Zum Inhalt springen

Hilfe:Tags

Aus Wikivoyage

Einführung

[Bearbeiten]

Ein charakteristisches Merkmal der Wikitexte sind die Tags. Bei der alltäglichen Artikelarbeit wird man aber wenig mit ihnen in Berührung kommen. Man findet sie eher im Projektnamensraum sowie in den meisten Fällen in Vorlagen und Modulen. Die Tags sind den Auszeichnungssprachen XML und HTML entlehnt. Benutzt werden Sie für verschiedene Anwendungen Zum einen werden Artikelteile inhaltlich und optisch vom Rest des Artikels getrennt bzw. herausgearbeitet oder einfach nur für externe Anwendungen bzw. Programme markiert. Der Inhalt dieser Hilfeseite richtet sich an daher an erfahrenere Benutzer und solche, die einen tieferen Einstig in die Gestaltung von Wikiseiten wünschen.

Auf dieser Hilfeseite wird ein vollständiger Überblick zur Anwendung in Wiki-Projekten gegeben. Kurzfassungen finden sich unter Textgestaltung. Eine andere Bedeutung des englischen Wortes Tag im Wiki wird unter Bearbeitungsmarkierung erläutert.

Hinweis: Benutze die Tags nicht für exzessive optische Ausgestaltung von Artikeln, oder um Textteilen eine individuelle Note zu verleihen. Halte dich an unsere Vorgaben und benutze unsere Vorlagen. Bespreche neue Ideen in der Vorlagenwerkstatt oder der Lounge.

Index

[Bearbeiten]

Bist du mit der Verwendung von Tags vertraut und möchtest Informationen zu einem einzelnen Tag nachschlagen, kannst du hier vom Index aus direkt an die passende Stelle in diesem Hilfeartikel springen.

Direkt zum Element:
<!-- --> a abbr Abschnitt acronym b bdi big blockquote br caption categorytree ce center charinsert chem cite code colgroup command dfn dd del div dl dt em font gallery graph h1 h2 h3 h4 h5 h6 hiddentext hiero hr i imagemap img includeonly indicator inputbox ins isindex kbd languages li maplink mark math nobr noinclude nowiki ol onlyinclude poem p pre q rb rbc ref references rp rt rtc ruby s samp score script section small source span strike strong style sub sup syntaxhighlight templatedata templatestyles timeline table td th tr translate tt u ul var wbr

Hilfe zu den im Wikitext gängigen Tags lässt sich auch fast immer erreichen, indem in das Suchfeld eingegeben wird: h:name    

Syntax

[Bearbeiten]

Die Syntax der Tags entspricht derjenigen von XML und HTML; zwischen beiden Sprachen gibt es minimale Unterschiede. Ein Tag hat im einfachsten Fall die Form <name> – nach der öffnenden spitzen Klammer < steht der Bezeichner. Er soll kleingeschrieben werden, wird aber auch mit Großbuchstaben verstanden. Die schließende spitze Klammer > beendet das Tag.

Grundsätzlich gibt es mehrere Fälle:

  • Anfang und Ende:
    Ein Textabschnitt wird von zwei Tags eingeschlossen, die den gleichen Bezeichner tragen. Das abschließende Tag führt zu Beginn einen Schrägstrich:
    <name>...</name>
    • Dem eingeschlossenen Bereich sollen dadurch bestimmte Eigenschaften zugewiesen werden.
    • Die gesamte Einheit aus Anfang, Ende und Inhalt nennt man Element.
    • Elemente können ineinander verschachtelt sein; allerdings muss ein inneres Element dann vollständig in einem äußeren Element enthalten sein.
  • unary tag wie <references /> (alleinstehend):
    • Sie haben keinen Inhalt; können aber steuernd wirken.
    • In Texten, die auch gelegentlich von Menschen gelesen werden (wie das regelmäßig bei Wikitexten der Fall ist), schreibt man zur besseren Lesbarkeit ein Leerzeichen vor den Schrägstrich, um das Tag sicher und fehlerfrei von der binary-Variante unterscheiden zu können, z.B. bei <references /> vs. </references>.
  • Leeres Element (etwa <div></div>).
    • Bei den Wiki-Extensionen kann dies immer durch das kürzere und schneller erfassbare unary tag ersetzt werden, wie das auch in XML vorgesehen ist.
    • In HTML wird immer noch eine Unterscheidung getroffen zwischen Tags, die nie Inhalt enthalten können (void),[1] und solchen, die prinzipiell Inhalt enthalten könnten, nur jetzt gerade leer sind. Im ersten Fall muss ein unary tag verwendet werden, im zweiten Fall (empty) darf kein unary tag benutzt werden. Dies kann insbesondere bei leerem <div> zu Schwierigkeiten führen. Seit Sommer 2016 ist es nicht mehr zulässig,[2] leere HTML-Elemente dieser Art durch ein „selbstschließendes“ unary tag in den Quelltext zu schreiben; das gilt ausdrücklich nicht für MediaWiki-Elemente und nicht für void-HTML.
  • Vorlagenprogrammierung:
    • Hier können Tags mittels der Funktion #tag: der normalen Verarbeitung zunächst entzogen werden.

Attribute

[Bearbeiten]

Weiterhin gilt:

  • Innerhalb von Tags sind Attributzuweisungen möglich. Dies gilt allerdings nur für das erste Tag (öffnend oder alleinstehend).
  • Sie haben das Format attribut="Wert usw."
  • Attributwerte sollen in " (ASCII-Zeichen, Code 3410) eingeschlossen werden (möglich, aber nicht üblich wären auch Apostroph ' als ASCII-Zeichen, Code 3910). Besteht der Attributwert nur aus einer Zahl oder einem einzelnen Wort,[3] würde das notfalls auch ohne Begrenzer verstanden werden. Das ist aber sehr fehleranfällig.
  • Die Namen von Attributen sollen kleingeschrieben werden.
  • Innerhalb der Tags dürfen außer dem Namen des Tags und der Attributzuweisungen keine anderen Inhalte stehen.
  • Zeilenumbrüche zwischen Attributzuweisungen sind zulässig, um lange Tags mit vielen Attributen übersichtlicher zu gestalten; jedoch keine Leerzeilen.
  • Das Zeichen < (wie auch >) darf nicht vorkommen.
  • Attribute dürfen sich in einem Tag nicht wiederholen.
  • Das Attribut-Format wird nicht nur innerhalb von Tags benutzt, sondern etwa auch bei Tabellen, wo die Attribute dann in die generierten HTML-Elemente eingefügt werden.
  • Einige wenige Attribute sind alleinstehend; es wird ihnen kein Wert zugewiesen und sie lösen durch ihre Anwesenheit einen Effekt aus. Das ist im Wikitext jedoch sehr selten.[4]

Einige häufige Standard-Attribute sind

Ob sie im konkreten Einzelfall auch wirksam sind, hängt vom Tag ab.

class

[Bearbeiten]

Die Klassen sind insbesondere wichtig für die Zuordnung von CSS, wie es projektweit etwa in MediaWiki:Common.css definiert ist und auch individuell vereinbart werden kann (CSS).

Achtung: Falls mehrere Klassen angegeben werden, müssen sie durch Leerzeichen voneinander getrennt werden; nicht mit Komma:

class="wikitable float-right"

Eine projektweit definierte Klasse ist error, mittels der auf allen Seiten Fehlermeldungen (etwa von Vorlagen) aufgefunden und einheitlich formatiert werden können.

Damit lassen sich Fragmente bilden, mit denen sich die Tags direkt verlinken lassen.

Für den Identifizierer gibt es Regeln:

  • Identifizierer müssen mit einem Buchstaben beginnen und dürfen kein # enthalten.
  • Sie sollten zur besseren Lesbarkeit in allen Situationen nur aus bestimmten ASCII-Zeichen gebildet werden, nämlich: A-Z a-z 0-9 . - / ( ) , ;
  • Identifizierer dürfen sich auf einer Seite nie wiederholen.
  • Sie sollten möglichst kurz und inhaltlich prägnant sein (Schlagwort), und von Menschen zweifelsfrei interpretiert und unterschieden werden („sprechend“).

style

[Bearbeiten]

Während mit class= CSS-Formatierungen für alle Elemente gleichzeitig zugewiesen werden, lässt sich mit style= ein einzelnes Element in einem bestimmten Stil darstellen. Dies erfolgt regelmäßig nur in der Vorlagenprogrammierung und kann in Artikeln ausnahmsweise benutzt werden; siehe auch Hilfe:CSS (Hilfe in der Wikipedia).

In der Vorlagenprogrammierung wird gelegentlich das Attribut lang= benutzt. Als Wert ist syntaktisch ein Sprachcode gemäß ISO 639 anzugeben; auch sinngemäße Wiki-Erweiterungen sind möglich. Es wird dem Element eine menschliche Sprache zugewiesen. lang="fr" kennzeichnet als französisch, lang="de-AT" als österreichisch. Das kann durch Screenreader oder zur Auswahl besonders geeigneter Schriftarten[5] ausgenutzt werden. Die Verwendung eines XML-Namensraums, also xml:lang="it", ist weder hier noch anderswo zulässig.

Die Zuweisung wird in Artikeln möglichst nicht direkt verwendet, sondern meist über Sprachvorlagen (z.B. {{Th}} für Thailändisch) erledigt (Kategorie: Vorlagen:Fremdsprachenunterstützung).

Schreibrichtung (Projektstandard: von links nach rechts); die Zuweisung wird in Artikeln nicht direkt verwendet, sondern über spezielle Vorlagen.

title

[Bearbeiten]

Auf allen sichtbaren Elementen wird der Inhalt als Tooltip dargestellt; in der Regel aber nur auf Desktop-Geräten und nicht auf Mobilgeräten mit Touchscreen. Der Inhalt des Atttributs ist einfacher Text ohne Markup; ein Zeilenumbruch kann mittels &#10; erzeugt werden.

Mit der Zuweisung einer leeren Zeichenkette title="" würde sich der Tooltip umgebender Bereiche unterdrücken lassen.

Diese Funktionalität darf nur unterstützende und keine bedeutungstragende Informationen anbieten, da sie technisch nicht von jedem Leser wahrgenommen werden kann und Leser auch nicht vermuten können, dass sie gelegentlich an einer unscheinbaren Stelle mittels Mauszeiger weitere Texte sichtbar machen könnten. Insbesondere für laufende enzyklopädische Artikeltexte ist dies nicht geeignet; bei Funktionsseiten und interaktiven grafischen Elementen kann der Leser auf die Möglichkeiten hingewiesen werden.

Veraltete Attribute

[Bearbeiten]

Die nachstehenden Attribute sind nicht mehr zeitgemäß und sollten im Rahmen von Überarbeitungen durch Zuweisungen im style= oder eine Klassenangabe ersetzt werden:

align= bgcolor= border= clear= height= valign=

Dadurch kommt es auch zu einer einheitlichen Nutzung von CSS statt unterschiedlicher historischer Sonderregelungen, die auf Dauer verwirren. In den meisten Fällen gehört auch width= dazu. Siehe Hilfe:CSS.

HTML-Tidy

[Bearbeiten]
  • Von der Wiki-Verarbeitung nicht abgefangene und selbst verarbeitete Tags bleiben im Text stehen. Zurzeit ist dafür auch die Aufnahme in eine Positivliste erforderlich; siehe Verbotenes HTML.
  • Sie werden somit zum Ausgabe-Dokument weitergereicht, und es sollte sich um gültige HTML-Syntax handeln.
  • Die Elemente der Wiki-Syntax (Links, Apostroph usw.) werden ggf. ebenfalls in HTML umgewandelt.
  • Bevor dies zum Leser ausgeliefert wird, läuft zurzeit noch das Programm HTML Tidy und versucht, das entstandene Gemenge zu interpretieren und als standardkonformes HTML zu formatieren. Mittelfristig wird das nicht mehr verwendet werden können; die Software entstand 1998 unter anderen Bedingungen.

Wiki-Erweiterung

[Bearbeiten]

Im deutschsprachigen Wikivoyage sind neben der Basis-Wikisyntax die folgenden nur in Wikis gültigen Tag-Bezeichner definiert:

categorytree ce charinsert chem gallery graph hiddentext hiero imagemap includeonly inputbox maplink math noinclude nowiki onlyinclude poem pre ref references score section (source) syntaxhighlight templatedata TemplateStyles timeline

charinsert

[Bearbeiten]

Dieses Element ist ausschließlich dafür vorgesehen, Verlinkungen zum Einfügen von Text-Elementen in das Bearbeitungsfeld zu programmieren. Der eingeschlossene Bereich wird umgewandelt in ein Link, das die wikibits-Funktion insertTags() aufruft. Derartige Links sind mit sonstiger Wikisyntax nicht möglich. Die einzufügenden Textschnipsel können über die Mitteilung Edittools parametriert werden. Für das Feature zeichnet die Mediawiki-Extension CharInsert verantwortlich.

nowiki

[Bearbeiten]

Im von <nowiki>...</nowiki> umschlossenen Bereich hat die Wiki-Syntax keine Wirkung. Alternativ kann man auch Entities verwenden, wenn nur wenige Zeichen maskiert werden sollen. Das ist in einem normalen Quelltext jedoch weniger gut lesbar und wäre eher etwas für die Vorlagenprogrammierung. Mit <nowiki /> als unary tag wird die Wiki-Verarbeitung unterbrochen; das wird bei Zusammensetzungen mit Wikilinks benutzt, wenn das anschließende Wort nicht als Linktitel dargestellt werden soll: Mondlandung über [[Mond]]<nowiki />landung.

Die Entities &...; sind keine Wiki-Syntax, wirken nur auf Zeichen-Ebene und werden durch nowiki nicht beeinflusst. Eine Quellcode-Wiedergabe, bei der auch Entities wie angegeben sichtbar bleiben, kann mit <syntaxhighlight lang="text"> erreicht werden.

Soll nowiki zwar im Prinzip Verlinkungen und andere Syntaxelemente unwirksam machen, jedoch Variablen (und Vorlagen) auswerten, lässt es sich für die Vorlagenprogrammierung und interne Dokumentationen mittels der Funktion #tag: darstellen:

{{#tag:nowiki| ... {{PAGENAME}} ... }}

noinclude

[Bearbeiten]

Das Tag <noinclude>...</noinclude> ist ein wichtiges Hilfsmittel zur Programmierung von Vorlagen. Der Inhalt dieses Tags wird beim Einbinden auf anderen Seiten nicht mit angezeigt. So kann man in eine Vorlage eine Dokumentation schreiben, die nur beim direkten Aufruf der Seite selbst sichtbar ist. Die Anwendung ist aber nicht auf den Vorlagennamensraum beschränkt. Hier ein Beispiel einer Vorlage:

Das ist der Ausgabetext. <noinclude>Das ist die Dokumentation.</noinclude>
  • Anzeige, wenn in einem Artikel eingebunden: Das ist der Ausgabetext.
  • Anzeige, beim Anzeigen der Vorlage: Das ist der Ausgabetext. Das ist die Dokumentation.

Möchte man das Tag in Artikelvorlagen einfügen, die beispielsweise bei der Anlage eines neuen Artikels automatisch generiert werden, muss man die Zeichenkette des Tags zerlegen, damit es bei Artikelanlage seine Wirkung noch nicht entfaltet. Dies ist zum Beispiel für die Anlage der Vorlagen für die Reiseziele des Monats notwendig. In dem Fall muss das Tag in der neuen Seite platziert werden, aber erst beim Speichern der neunen Seite soll es wirken. Mit folgendem Trick funktioniert das (hier aus dem folgenden Skeltett: Vorlage:Reiseziel des Monats/Layout/Skelett):

<no<includeonly></includeonly>include>{{Dokumentation|Vorlagen für die Hauptseite}}</no<includeonly></includeonly>include>

Mit Hilfe der Wikifunktion preload (angegeben in der URL (siehe Quellcode von Vorlage:Vorlagen für die Hauptseite/Buttons) erzeugt man eine neue Seite, die den Inhalt des angegbenen Skelettes bereits enthält. Aus dem gerade angegeben Code wird beim Vorausfüllen der Seite folgendes

<noinclude>{{Dokumentation|Vorlagen für die Hauptseite}}</noinclude>

Beim Speichern der neuen Seite, entfaltet <noinclude>...</noinclude> dann seine Wirkung.

includeonly

[Bearbeiten]

Das Tag <includeonly>...</includeonly> ist ein weiteres wichtiges Hilfsmittel zur Programmierung von Vorlagen. Der Inhalt dieses Tags wird nur beim Einbinden auf anderen Seiten angezeigt, aber nicht wenn man die Vorlage selbst aufruft. So kann man in eine Vorlage nur eine Dokumentation schreiben, die Ausgabe der Vorlage aber unterdrücken (weil ja notwendige Parameter fehlen). Die Anwendung ist aber nicht auf den Vorlagennamensraum beschränkt. Hier ein Beispiel einer Vorlage:

<includeonly>Das ist der Ausgabetext.</includeonly> Das ist die Dokumentation.
  • Anzeige, wenn in einem Artikel eingebunden: Das ist der Ausgabetext. Das ist die Dokumentation.
  • Anzeige, beim Anzeigen der Vorlage: Das ist die Dokumentation.

Perfekt ist es, wenn man das Tag mit <noinclude>...</noinclude> kombiniert.

<includeonly>Das ist der Ausgabetext.</includeonly><noinclude>Das ist die Dokumentation.</noinclude>
  • Anzeige, wenn in einem Artikel eingebunden: Das ist der Ausgabetext.
  • Anzeige, beim Anzeigen der Vorlage: Das ist die Dokumentation.

onlyinclude

[Bearbeiten]

Das Tag <onlyinclude>...</onlyinclude> wird ebenfalls zur Programmierung von Vorlagen. Der Inhalt dieses Tags wird nur beim Einbinden auf anderen Seiten angezeigt, der Rest aber nicht, auch wenn er nicht in einem extra Tag gekapselt ist. Hier ein Beispiel einer Vorlage:

Das ist eine Einführung. <onlyinclude>Das ist der Ausgabetext.</onlyinclude> Das ist die Dokumentation.
  • Anzeige, wenn in einem Artikel eingebunden: Das ist der Ausgabetext.
  • Anzeige, beim Anzeigen der Vorlage: Das ist eine Einführung. Das ist der Ausgabetext. Das ist die Dokumentation.

Parser-Tags

[Bearbeiten]

Zusätzlich kann jedes Projekt individuell optionale Software-Komponenten zusammenstellen, die Extensionen („Erweiterungen“); siehe Spezial:Version.

HTML-Philosophie

[Bearbeiten]

Die in unserem Wikitext erlaubten HTML-Elemente tragen nach zwei Methoden zum dargestellten Text bei:

  1. Inline-Elemente – sie beeinflussen die Schriftgestaltung innerhalb eines Fließtextes; also dessen Farben, Größe, Schriftart und mehr.
  2. Block-Elemente – sie arrangieren das Layout der Seite. Jedes Block-Element lässt sich als ein rechteckiges Zettelchen vorstellen; auf der Seite werden dann vom Browser all diese Rechtecke nebeneinander, selten ineinander und ansonsten untereinander angeordnet.
  3. Kommentare sind zwar erlaubt, wirken aber nicht auf das generierte HTML-Dokument.

Inline-Elemente

[Bearbeiten]
  • Das universelle Inline-Element in HTML heißt <span>.
    • Dies ist nur sinnvoll, wenn ihm auch Attribute mitgegeben werden.
  • Weitere gebräuchliche wären beispielsweise: <small> <sub> <sup> <code>
  • In der Regel treten Inline-Elemente paarig auf, also mit Anfangs- und End-Tag, und erwarten Textinhalt dazwischen.
  • <br /> ist eine Ausnahme davon, ist Teil des Fließtextes und ebenso das seltene <wbr />.
  • Die Wikisyntax steuert bei: '' und ''' für Kursiv- und Fettschrift sowie alle Verlinkungen.

Innerhalb der Spannweite eines Inline-Elements darf niemals ein Block-Element auftreten; auch nicht das Ende eines Absatzes.

  • <code> erlaubt auch keinen Zeilenumbruch, da es nur für Einzelwörter oder kurze Wortgruppen gedacht ist.
Zurzeit versucht noch HTML-Tidy zu erraten, was Autoren bei ungültigen Verschachtelungen gemeint haben könnten.

Der einfache Text, ggf. streckenweise mit Inline-Elementen besonders formatiert, wird (typischerweise als Fließtext) in ein Block-Element „hineingegossen“.

Block-Elemente

[Bearbeiten]
  • Das universelle Block-Element in HTML heißt <div>...</div>. Es wird in der Regel ein Attribut tragen.
  • Block-Elemente bedürfen in HTML nahezu immer eines Anfangs- und End-Tags; zumindest sofern im Wikitext erwünscht.
  • Von den Elementen der Wikisoftware sind Block-Elemente:
    • Alle Absätze (etwa durch Leerzeile beendet).
    • Alle Überschriften.
    • Alle Aufzählungen und Listen und jedes einzelne Element darin.
    • Alle Tabellen, Tabellenzeilen und einzelne Tabellen-Zellen.
    • Vorformatierter Text mit einem Leerzeichen zu Beginn der Zeile.
    • <pre>, wodurch ein HTML-Element gleichen Namens maskiert wird.

Block-Elemente können einfachen Text (ggf. streckenweise mit Inline-Elementen formatiert) sowie andere Block-Elemente enthalten.

Sie können zentriert ausgerichtet sein oder für den Layoutfluss adressiert werden; zumindest das Element als Ganzes, etwa die gesamte Tabelle.

Generiertes HTML

[Bearbeiten]

Die Basis-Syntax der Wikisoftware generiert letzlich auch immer HTML-Elemente, die in das HTML-Dokument eingefügt werden.

  • Meist handelt es sich um Block-Elemente.
  • Zu den Inline-Elementen gehören '' und ''' für Kursiv- und Fettschrift, auch alle Verlinkungen.
  • Bilder können in beiden Rollen auftreten; standardmäßig sind sie Inline-Elemente, aber mit Parametern etwa als Miniaturbild werden sie zum Block-Element.
  • <ref> ist inline an der Stelle, wo das Endnotenzeichen auftritt; die Einzelheiten selbst im Block <references> sind ein Aufzählungspunkt und somit Teil eines Blockes.
  • <syntaxhighlight> ist standardmäßig Block-Element, hat aber einen Parameter inline, der das umkehrt.
  • Bei eingebundenen Seiten (etwa Vorlagen) gilt, was sich aus der Expansion ergibt.

Sinnvolles HTML für Artikel und Seitentexte

[Bearbeiten]

Uneingeschränkt auf allen Seiten sinnvoll ist nur ein kleiner Teil an Elementen aus der allgemeinen Hypertext Markup Language:

<!--…--> br code div small sub sup tt

Im laufenden Artikeltext sind ungewöhnliche Formatierungskonstrukte für die anderen Autoren unverständlich und störend; hier sollten sie in allgemein verwendbare Vorlagen mit einem sprechenden Namen eingebettet werden. Autoren allgemeiner Artikel sollen im Fließtext nicht mit kryptischen Syntaxbasteleien konfrontiert werden.

Bei Tabellen und schematischen Darstellungen im Artikel kann der Einsatz von Farben und besonderer Formate über die Standard-Elemente hinaus erforderlich und sinnvoll sein.

In fremdsprachlichen Textabschnitten (insbesondere in asiatischen Schriften) wäre auch die Ruby-Notation und weitere Schrift-Information vorstellbar mit den Elementen

bdi ruby rb rp rt rtc

– dazu würde auch das zurzeit von der Software nicht unterstützte rbc gehören.

Auf einer Positivliste vermerkte HTML-Elemente werden von der Wiki-Software in den Ausgabetext durchgereicht. Bei unbekannten Elementen werden auch die Tags dargestellt und unwirksam; Gleiches gilt für alle ausdrücklich verbotenen Elemente. Damit können zwar die meisten HTML-Elemente benutzt werden; es sind aber nicht alle HTML-Elemente im Wikitext wünschenswert und sinnvoll.

Kommentar

[Bearbeiten]
  • Ein Kommentar beginnt mit der Zeichenkette <!-- und endet mit der Zeichenkette --> (auch über Leerzeilen hinweg).
  • Der Kommentar erscheint nicht auf der dargestellten Seite; er wird auch nicht als Kommentar in die generierte HTML-Seite eingebettet.
  • Text zwischen den beiden äußeren Zeichenketten darf weder mit der Zeichenkette > oder der Zeichenkette -> beginnen, noch die Zeichenketten <!--, --> oder --!> enthalten, noch mit der Zeichenkette <!- enden.
    Tags sollen innerhalb des Textes eines Kommentars möglichst nicht enthalten sein. Ist dies doch der Fall, so ist unbedingt darauf zu achten, dass die Tags außerhalb der Kommentare weiterhin in sich geschlossene Konstrukte bilden, jedes void element (Element in der Form eines unary tag) also mit seinem vollständigen Start-Tag unzerrissen, entweder gänzlich außerhalb oder gänzlich innerhalb eines Kommentars steht, und bei jedem sonstigen Element sowohl der es abgrenzende Start-Tag als auch der es abgrenzende End-Tag gemeinsam entweder gänzlich außerhalb oder gänzlich innerhalb eines Kommentars stehen.
  • Als Kommentare sind vorgesehen:
    • Technische Hinweise für Bots, Skripte und Autoren, etwa
      • <!-- sic! -->
      • <!--schweizbezogen-->
    • Technische Hinweise für andere Autoren; etwa auf Formatvorlagen oder Parameterwerte, Einbindung dieser Seite durch andere Seiten, Aktualisierung durch Bots.
    • Kleine Hinweise für andere Autoren zur Formatierung; mögliche Verwechslungen oder kleine Schreib- und Formatfehler im Original; technische Details zu Quellenangaben und Verlinkungen oder sonstige Tücken; Warnung vor unerwünschten Aufblähungen.
  • Allgemeine inhaltliche Hinweise gehören auf die Diskussionsseite zum Artikel oder für alle Leser sichtbar im Text vermerkt.

Ausführlich siehe hier.

  • Das Element <br /> erzeugt einen Zeilenumbruch innerhalb eines Textblocks.
  • Am Ende von Textblöcken <br /> ist unwirksam und deshalb überflüssig. Das können beispielsweise sein: Ein Absatz, eine Aufzählungsposition, Tabellenzellen oder Bildlegenden. Am Anfang eines solchen Blocks könnte ein Umbruch ebenfalls wirkungslos sein.
  • Das Element <br /> hat keine gültigen Attribute; insbesondere nicht clear=.
  • Zur Typografie gilt:
    • Im Fließtext von Artikeln ist ein Abbruch des Leseflusses unerwünscht. Entweder beginnt man einen neuen Gedanken und macht dazu einen neuen Absatz (durch Leerzeile/n) oder man setzt den Gedankengang in derselben Zeile fort.
    • Sinnvoll sind Zeilenumbrüche dort, wo auf begrenztem Raum eine optische Gliederung erfolgen soll: Tabellenzellen und Bildlegenden; auch die inhaltliche Gliederung einer einzelnen Aufzählungsposition (Listenpunkt) ohne Beginn einer weiteren Nummerierung oder eines zusätzlichen Aufzählungszeichens.
    • Zwei aufeinanderfolgende Zeilenumbrüche sind in der Regel nicht sinnvoll; hier ist ein Absatz zu machen.
  • Das <br /> kann innerhalb einer Quelltext-Zeile stehen, eine neue Quelltext-Zeile muss nicht begonnen werden. Allerdings erleichtert ein Zeilenwechsel im Quelltext das Behalten der Übersicht für nachfolgende Autoren (außer in Listenpunkten: dort unterbricht jeder Zeilenwechsel die Auflistung/-zählung).
  • In HTML4 war die Schreibweise nur <BR>, anders das <br /> der XHTML-Spezifikation, welches in den nachfolgenden Web-Standard HTML5 gleichberechtigt übernommen wurde. Intern werden alle diese Tags (HTML5-konform) in <br> umgewandelt. Trotzdem sollte nur <br /> geschrieben werden. Es ist zwingend ein unary tag; <br></br> sind daher zwei Zeilenumbrüche und kein leeres Element.
  • Das <br /> wird unmittelbar an das Ende der Zeile angefügt. Es gehört ebenso zu dieser Zeile wie auch die in Textverarbeitungsprogrammen gelegentlich dargestellte Absatzmarke  . Darauf könnte auf Wunsch zunächst ein Leerzeichen, eine neue Quelltext-Zeile oder sofort die nächste inhaltliche Zeile folgen:
    Am Ende einer Zeile
    steht das Absatzzeichen.

Mittels <code>...</code> werden im laufenden Text Bereiche in Schreibmaschinenschrift dargestellt. Damit sind Buchstaben deutlich unterscheidbar; etwa i I l 1 | können nicht verwechselt werden. Das ist für Computercode interessant.

  • Wikisyntax wird innerhalb des Bereichs ersetzt.
  • Mittels <code> wird standardmäßig ein Rahmen dargestellt; das Element ist nur für sehr kurze, also einzeilige Schlüsselwörter oder Textsequenzen vorgesehen. Ein Zeilenumbruch ist nicht sinnvoll. Mehrzeilige Textpassagen können mittels <tt> in Schreibmaschinenschrift dargestellt werden.
  • Wenn ein ganzer Textblock in Artikeln dargestellt werden soll, empfiehlt sich der Einschluss mittels <syntaxhighlight lang="text"> (oder spezifischere Formate).
    • Bevor diese Möglichkeit vorhanden war, hatte man <code> für solche Zwecke verwendet.
    • Linktexte sind damit aber leider auch nicht erkennbar, wenn die Ausdehnung von Verlinkung und Code-Block gleich sind. Dafür und bei farbigem Hintergrund muss noch auf <tt> ausgewichen werden, oder die <code>-Tags müssen die vollständige Verlinkung umschließen.
  • Wenn der Zeilenumbruch in einer kurzen Code-Sequenz vermieden werden soll, lässt sich schreiben:
    <code style="white-space: nowrap"></code>
    Längere Sequenzen gehören in einen eigenen Block.
  • <code> ist Nachfolger des veraltenden <tt>.
  • Möchtest du Tastatureingaben/-befehle darstellen, kannst du auch die Vorlage{{Key press}} benutzen.

Mittels <div> wird ein Element auf der Textblocks-Ebene definiert. Ein Textblock beginnt im Regelfall in einer neuen Zeile; ansonsten gehören auch Tabellenzellen und Bildlegenden dazu.

In Artikeln ist außerhalb von schematischen Darstellungen nur eine einzige Verwendung erforderlich:

  • <div style="clear: both;"></div>

Damit wird bewirkt, dass nach Einbindung von Bildern oder Tabellen das Seitenlayout wieder über die volle Breite reicht; erforderlichenfalls wird ein Leerraum bis unter das unterste vorangegangene Bild eingefügt.

Nicht zulässige und nicht von allen Browsern verstandene Formen sind

  • <br style="clear: both;" />
    • br ist kein Element auf Textblock-Ebene, wie es für das Seitenlayout erforderlich wäre.
  • <div style="clear: all;" />
    • Das Schlüsselwort lautet both.
  • <div clear="all" />
    • clear ist kein standardisierter Attribut-Name.
  • <div style="clear: both;" />

Daneben wäre statt both auch noch left und right als Schlüsselwort vorstellbar; dies ist aber für die Gestaltung normaler Wiki-Seiten irrelevant.

In der Vorlagenprogrammierung werden <div>-Elemente benutzt, um Textblöcken Klassen und Stile zuzuweisen; das mag auch zu grafischen Darstellungen in Artikeln eingesetzt werden.

small

[Bearbeiten]
  • Der Text wird eine Stufe kleiner geschrieben. Damit sollte man es im normalen Text bewenden lassen, nur im Formelsatz können weitere Verkleinerungen sinnvoll sein.
  • Oft ist eine kleinere Schrift typografisch aber überhaupt nicht sinnvoll; es könnte genausogut in normaler Schriftgröße geschrieben und dafür in Klammern gesetzt werden.
  • Innerhalb bereits kleiner geschriebener Bereiche ist eine weitere Verkleinerung teils technisch unwirksam (weil je nach Skin nicht relativ zur Umgebung gerechnet wird), teils führt dies dazu, dass Leser mit Augenproblemen den Text nicht mehr lesen können oder Endgeräte die Zeichen nicht mehr unterscheidbar darstellen. Innerhalb von sub und sup, Bildlegenden, ref soll small nicht benutzt werden.

sub sup

[Bearbeiten]

Die Elemente <sub>...</sub> und <sup>...</sup> bewirken die Tief- und Hochstellung des eingeschlossenen Textes. Dieser wird gleichzeitig kleiner geschrieben. Dabei soll kein zusätzliches <small> benutzt werden; auch sollen keine anderen <sub>...</sub> oder <sup>...</sup> enthalten sein. Für solche Fälle (Formelsatz) gibt es <math>.

Zur Typografie und Zeichenkodierung gilt:

  • Die Exponenten für Quadrat und Kubik bei Einheiten (etwa m² und m³) werden nicht mit <sup> geschrieben, sondern mit den einzelnen Zeichen ² und ³ (PC-Tastatur: AltGr+3); ANSI 17810 und 17910, auch erreichbar über die Eingabehilfen unter dem Bearbeitungsfeld.
  • Alle anderen Exponenten werden mit <sup> geschrieben, auch wenn es dafür Unicode-Definitionen gibt. Diese werden jedoch nicht bei allen Lesern dargestellt.
  • Treten in einer Textpassage Quadrate und andere Exponenten gleichzeitig auf, sind alle Exponenten einheitlich mit <sup> zu formatieren, weil die grafische Darstellung meist etwas abweicht.
  • In der musikalischen Notation werden alle hochgestellten Ziffern einheitlich mit <sup> geschrieben.
  • Die tiefgestellten Indizes werden immer mit <sub> geschrieben, auch wenn es dafür einige Unicode-Werte gibt. Diese werden jedoch nicht bei allen Lesern dargestellt.

Beispiel: T<sub>A</sub><sup>−1</sup> wird zu TA−1.

Das HTML-Element <tt>...</tt> (kurz für teletype text) bewirkte die Darstellung in Schreibmaschinenschrift.

  • Die Wirkung entspricht grundsätzlich der von <code>.
    • Es gibt Unterschiede betreffend Hintergrundfarbe (transparent) und Schriftgröße; auch abhängig vom Kontext und Skin.
    • Während <tt> auch mehrzeilige Textpassagen erlaubt, ist <code> standardmäßig mit einem Rahmen umgeben und nur für sehr kurze, also einzeilige Schlüsselwörter oder Textsequenzen vorgesehen.

<tt> ist (mit HTML5) eine veraltete und langfristig nicht mehr unterstützte Notation in HTML. Weil sie jedoch sehr leicht zu tippen ist, wird dies aber noch häufig in Wikitexten anzutreffen sein. Sollte sie einmal nicht mehr von Browsern unterstützt werden, kann ihre Wirkung sehr leicht durch ein MediaWiki-Element gleicher Syntax wahrgenommen werden.

Auf Wikisource wird oder wurde <tt>...</tt> abweichend vom HTML-Standard zur Darstellung in Antiqua-Schriften benutzt.

HTML außerhalb der Artikel

[Bearbeiten]

Für die Vorlagenprogrammierung, bei Funktionsseiten vor allem zu technischen Angelegenheiten und in Diskussionen oder auf Benutzerseiten kommen weitere Elemente in Frage:

abbr del ins mark pre s span strike

Innerhalb von Artikeltexten sind sie nur im Ausnahmefall einzusetzen.

<span>...</span> ist ein Universal-Element für beliebige Textformatierungen. Alle anderen Formatierungselemente auf Zeichen-Ebene ließen sich im Prinzip durch span ersetzen. Im Unterschied zu <div> wirkt es inline, das heißt innerhalb eines Textblocks (Absatzes) und ordnet insbesondere die Attribute class, id, style einem Textstück zu.

Im Regelfall werden die dadurch entstehenden, zuweilen komplizierten Gebilde nur innerhalb der Vorlagenprogrammierung und auf Funktionsseiten zu technischen Angelegenheiten verwendet.

Mit <pre> wird ein Block an kodierter Information dargestellt, das heißt in Schreibmaschinenschrift und mit dem vorgefundenen Zeilenumbruch des Quelltextes.

  • Als Wikisyntax wären auf normalen Seiten Zeilen mit einem Leerzeichen als erstes Zeichen jeder Zeile zu verwenden.
    • Im Unterschied dazu wird aber innerhalb von <pre>...</pre> die meiste Wikisyntax nicht interpretiert; es ist also gleichsam eine Kombination mit <nowiki>.
  • Es ist eine Wiki-Erweiterung, die einem gleichbenannten HTML-Element überlagert ist.
  • Eine Alternative wäre <syntaxhighlight> – ggf. mit lang="text" universell.

abbr acronym

[Bearbeiten]

Mit <abbr> (und <acronym>) lassen sich Abkürzungen als solche kennzeichnen. Die semantisch feine Unterscheidung zwischen beiden Elementen hat sich kaum durchgesetzt.

  • In der HTML-Welt hat <acronym> keine Zukunft. Die Ausdifferenzierung (Abkürzung, Akronym, Apronym, Initialwort, Silbenkurzwort; expandiert, in Worten gesprochen oder buchstabiert [Screenreader]) soll zukünftig über anwenderspezifisches class= nur noch mittels <abbr> erfolgen.[6]

MediaWiki hat zurzeit <acronym> nicht auf der Positivliste.

Neben Verlinkungen und Bildern waren das in HTML.4 die einzigen grafischen Elemente, die einen Tooltip anzeigen, wenn man mit dem Mauszeiger darüber fährt; dies sollte die Erläuterung zur Abkürzung sein. Für modernere Browser kann auch das Universalattribut title= jedem sichtbaren Element zugeordnet werden; allerdings wissen Leser zunächst nicht, dass sie einen Tooltip erhalten würden, wenn sie den Mauszeiger dorthin bewegen.

In Artikeln wird dieses Element nicht verwendet; Wikilinks auf die Langform zu einer Abkürzung haben hinsichtlich des Tooltips den gleichen Effekt.

In der MW-Software gibt es die analoge class="explain" und ermöglicht individuelle Erklärungen. Sie arbeitet mit der CSS-Deklaration cursor:help – diese ist ab CSS2 (1998) verfügbar, unterstreicht den Bereich üblicherweise mit einer gestrichelten Linie und zeigt meist ein Fragezeichen, wenn der Cursor dort steht.

Redaktionelle Markierungen

[Bearbeiten]

s strike

[Bearbeiten]

Mit diesen Tags wird der dazwischen liegende Text durchgestrichen.

Mit HTML5 (schon seit HTML4) ist <strike> nicht mehr standardkonform; <s> hat seine Semantik leicht gewandelt, was für Wiki-Anwendungen irrelevant ist.

del ins

[Bearbeiten]

Diese Elemente gehen über die reine Textformatierung hinaus; hier sollen auch Angaben zum Autor (Verlinkung) und Zeitpunkt gemacht werden und es soll eine optische Zuordnung (Farben) zu den einzelnen Veränderungsphasen oder Autoren sichtbar werden. <del> wird meist durchgestrichen dargestellt.

Das mag in einem Artikel zur Entstehung von Gedichten, Gesetzestexten usw. einmal sinnvoll sein, wäre ansonsten allenfalls bei der Erarbeitung Wiki-interner Texte einzusetzen.

Die Kennzeichnung <mark> (Textmarker-Funktion) ist eher gedacht zur dynamischen Einfügung in die fertige HTML-Seite, als dass es im Quelltext des Wikis dauerhaft vorhanden sein sollte (hierfür wäre <span> zu verwenden).

Mit <mark> kennzeichnet man in einem statischen Text vorübergehend den Bezug zu wechselnden Anmerkungen oder Belegen, oder man markiert das Vorkommen von aktuellen Suchbegriffen. Die konkrete Farbe wird dynamisch vom Browser so festgelegt, dass sie mit den im markierten Bereich vorhandenen Schrift- und Hintergrundfarben kontrastiert.

Die MediaWiki-Installation übersteuert allerdings im Moment dieses Verhalten und gibt explizit vor: Schwarze Schrift auf gelbem Hintergrund, weil älteren Browsern das neue HTML-5-Element unbekannt ist und wirkungslos bleiben würde.

Unerwünschtes HTML

[Bearbeiten]

Es sind über 110 verschiedene Element-Namen in HTML bekannt. Sie tragen teils kontextabhängige semantische Feinheiten, teils sind sie veraltet. Wiki-Autoren sollen sich damit nicht auseinandersetzen müssen.

Wikisyntax

[Bearbeiten]

Wo die Wikisyntax selbst Möglichkeiten bietet, sollen keine HTML-Elemente eingebracht werden.

ElementBedeutungErsatz durch Wikisyntax
b strong Hervorhebung; Fettschrift Drei Apostrophzeichen '''
i em Hervorhebung; Kursivschrift Zwei Apostrophzeichen ''
p Absatz Leerzeile
<hr /> Trennlinie Vier Bindestriche ----
Im Artikel-Layout unerwünscht
ol ul li Aufzählung Stern * und Hashcode #
dl dt dd Definitionsliste Semikolon ; und Doppelpunkt :
h1 h2 h3 h4 h5 h6 Überschrift Gleichheitszeichen =
table td th tr thead caption tbody col colgroup tfoot Tabellensyntax Tabellensyntax

Gelegentlich werden temporär auf internen Funktionsseiten wie etwa Wartungslisten die Ergebnisse externer Software eingetragen, die laufend aktualisiert werden. Sie sind ggf. nicht in Wikisyntax, sondern mittels HTML formatiert, und dort ist das auch nicht zu beanstanden.

Formatierung

[Bearbeiten]

Diese Tags sollen in Artikeln und Projektseiten nicht verwendet werden. Nur im Rahmen der Vorlagenprogrammierung wird ggf. von den semantischen Eigenschaften der ersten drei Tags Gebrauch gemacht.

ElementBedeutungErsatz
<blockquote> Blockzitat Vorlage {{Zitat}} oder fremdsprachliche Varianten
<q> eingebettetes Zitat Vorlage {{"}}
<cite> Titel eines Werks Kursivschrift
<u> Unterstreichung Kursivschrift
(; Irritation der Leser)

Ungebräuchliches HTML

[Bearbeiten]

Gelegentlich wird noch gefunden oder thematisiert:

ElementBedeutungErsatz
big Große Schrift style="font-size:larger;"
center Zentrierung class="centered"
class="center"
font Schrifteigenschaften style="…"
dfn, kbd, samp, var Software-Dokumentation <code>
nobr Kein Zeilenumbruch
(Nicht standardisiert)
style="white-space:nowrap;"
<wbr /> Worttrennung möglich (ohne Trennstrich)
(Seit HTML5 standardisiert)
Im Fließtext unerwünscht
&shy; (mit Trennstrich)
Im Fließtext unerwünscht

Es gibt noch etliche weitere Tags in HTML; diese waren aber bislang in Wikitexten nicht in Erscheinung getreten.

Dieses Element soll nicht verwendet werden.

  • Zeichen aus außereuropäischen Schriften sind in die entsprechenden Vorlagen der Vorlagen:Fremdsprachenunterstützung einzubetten, die auch andere Eigenschaften projektweit geeignet zuordnen.
  • Für Überschriften ist Wikisyntax zu benutzen.
  • Zwischenüberschriften etwa in Infoboxen sind bei der Vorlagenprogrammierung über <span> zu realisieren.

Mit HTML5 ist <big> auch nicht mehr standardkonform.

center

[Bearbeiten]

Mittels <center> wurde ein Element innerhalb eines Blocks (horizontal) mittig ausgerichtet. Es wird nicht gern gesehen, Artikel nach individuellem Geschmack umzugestalten; Bildlegenden usw. folgen einem einheitlichen Layout. Wo wirklich erforderlich, kann mit dem Attribut class="centered" ein ganzer Block zentriert werden; außerdem mit class="center" fast jedes Tag zur mittigen Ausrichtung seines Inhalts gebracht werden. Näheres siehe auf TG/Zentrieren.

Mit HTML5 (schon seit HTML4) ist <center> nicht mehr standardkonform; es sollte deshalb nicht mehr neu eingefügt und allmählich aus der Wikipedia entfernt werden. Es kann durch die genannten class ersetzt werden.

Bei Tabellen ist class="center" der adäquate Ersatz für einzelne Felder oder die Tabelle insgesamt, in Fällen ohne Element steht, wenn erforderlich, die Vorlage:Center zur Verfügung.

Dieses Element spezifizierte Einzelheiten zur Schriftart, Schriftgröße oder andere Darstellungsformen. Das wird seit langem über das allgemeinere <span style=""> realisiert. Mit HTML5 ist <font> nicht mehr standardkonform, war schon 1998 mit HTML4 obsolet und sollte unbedingt aus allen Wikiseiten entfernt werden.

Im Übrigen sind die Wiki-Seiten schlicht gehalten und verwenden nicht lauter verschiedene fein abgestufte Schriftgrößen. Für außereuropäische Schriften werden dem Browser Hinweise zu geeigneten Zeichensätzen über entsprechende Vorlagen gegeben.

HTML 2

[Bearbeiten]

<dfn>...</dfn>, <kbd>...</kbd>, <samp>...</samp> und <var>...</var>

In HTML 2 gemäß RFC 1866 von 1995 gab es noch kein CSS und keine style-Vereinbarungen. Deshalb musste jedes unterschiedliche Markup damals ein gesondertes Element erhalten.

Seinerzeit sah man als wesentliches Einsatzgebiet die Erstellung technisch-wissenschaftlicher Dokumente; insbesondere auch automatisch generierte Software-Dokumentation, die durch spezielle Tags unterstützt werden sollte. Aus diesem Kontext stammen die dfn kbd samp var – heute benutzt man dafür Klassen und CSS-Stile.

Als Darstellung für kbd und samp war Schreibmaschinenschrift vorgesehen; var und dfn werden meist kursiv dargestellt.

Für Tastatur-Eingaben einzelner Zeichen verwenden wir nicht direkt <kbd>, sondern {{Taste}}; bei allen anderen Anwendungen steht <code> oder <syntaxhighlight> zur Verfügung; selbst <tt>. Kursivschrift wird durch Apostrophe erreicht.

Das Element <samp> hat die semantische Bestimmung, den Output oder die Antwort von Computerprogrammen darzustellen. Zusammen mit <kbd> bildet es den Eingabe-Ausgabe-Dialog von textorientierten Konsolen der damaligen Zeit. Auf keinen Fall dürfen diese semantischen Elemente dazu missbraucht werden, Schreibmaschinenschrift zu generieren, nur weil das zufällig auch die gängige Darstellungsweise sei.

Andere Wikiprojekte

[Bearbeiten]

Nicht in der deutschsprachigen Wikipedia, aber in anderen Wikiprojekten könnte man zusätzlichen Wiki-Erweiterungen begegnen. Dazu gehören:

<languages />
Weist in mehrsprachigen Projekten auf der üblicherweise englischsprachigen Oberseite darauf hin, dass bestimmte Übersetzungen in Form von Unterseiten vorliegen.
<translate>...</translate>
Markiert in mehrsprachigen Projekten übersetzte Bereiche zu einer üblicherweise englischsprachigen Fassung.

Verbotenes HTML

[Bearbeiten]

Aus Sicherheitsgründen sind eine Reihe von HTML-Anweisungen ausschließlich über Wikisyntax möglich. Sie werden dabei auf böswillige Techniken überprüft. Es sind Verlinkungen und die Ausführung fremder Software. Wenn externe Ressourcen (Bilder, Multimedia, fremde Texte und Webseiten) direkt als Inhalte eingebunden würden, könnte es außerdem zu Urheberrechtsverletzungen kommen.

Alle direkten Verwendungen solcher Tags werden vom „Sanitizer“ auf dem Wiki-Server ausgefiltert.[7]

Betroffen sind („blacklist“):

a applet area audio base body button canvas command embed form frame frameset head html iframe img input isindex layer link map meta object option param script select (source) style textarea title track video xml

Übrigens wird auch das URL-Format für Hintergrundbilder[8] im style-Attribut entfernt.

Die derzeitige Strategie ist, auch alle nicht explizit als geeignet bekannten HTML-Elemente auszufiltern. Alternativ würden im Wikitext vorgefundene unverstandene Elemente in den Ausgabetext durchgereicht, sofern sie nicht explizit verboten wären; durch die Vielzahl an Browser-Entwicklungen und neu definierter Tags ist das aber nicht mehr sicher genug.

Damit ist auch Pseudo-HTML wie <Scherz> unmittelbar möglich; zurzeit wird das < nur umgesetzt, wenn darauf ein erkanntes Tag von der Positivliste folgt. Das Escapen des < etwa als &lt; ist zurzeit nicht zwingend erforderlich; es kann aber auch nicht schaden, falls der Wikitext einmal anders interpretiert wird. Das schließende > braucht in diesen Fällen grundsätzlich nicht maskiert zu werden.

Nicht unterstützt

[Bearbeiten]

Zu den sicherheitstechnisch unschädlichen und prinzipiell vorstellbaren, aber zurzeit nicht gelisteten Elementen gehören:

acronym address fieldset label noscript rbc

Sie sind weltweit wegen unnötiger Verkomplizierung des Wikitexts unerwünscht.[9] Die Software ignoriert diese genau wie verbotene Elemente.

Anhang: Entities

[Bearbeiten]
Hex-  Zeichen Dez-  General-
&#x22; – "&#34; – &quot;
&#x23; – #&#35; &num;
&#x26; – &&#38; – &amp;
&#x27; – '&#39; – &apos;
&#x2A; – *&#42; &ast;
&#x3A; – :&#58; &colon;
&#x3B; – ;&#59; &semi;
&#x3C; – <&#60; – &lt;
&#x3D; – = – &#61; – &equals;
&#x3E; – >&#62; – &gt;
&#x5B; – [&#91; &lsqb;
&#x5D; – ]&#93; &rsqb; 
&#x7B; – {&#123; &lcub;
&#x7C; – |&#124; &vert;
&#x7D; – }&#125; &rcub;
&#x7E; – ~&#126; (TILDE)
&#xA7; – §&#167; &sect;
Unsichtbare (Whitespace):
&#xA0; –  &#160; – &nbsp;
&#x20; –  &#32; (SPACE)
&#xAD; – – &#173; – &shy;
&#x2009; –&#8201; &thinsp;
&#x200A; –&#8202; (HAIR SPACE)
&#x202f; –&#8239; (NARROW NO-BREAK)

Keine HTML-Tags, aber thematisch verwandt sind Zeichen-Entitäten: &...;

Hier gilt für die deutschsprachige Wikipedia, insbesondere den Artikelnamensraum:

  • Das einzige regulär zu verwendende entity ist das geschützte Leerzeichen &nbsp;. Da es die Lesbarkeit des Quelltexts beeinträchtigt, sollte es nur eingesetzt werden, wenn der Nutzen überwiegt, wenn also die durch einen Zeilenwechsel verursachte Beeinträchtigung der Lesbarkeit des angezeigten Texts gravierend wäre. Grundregel ist, dass mindestens eines der verbundenen Textelemente sehr kurz sein muss, also nur wenige Zeichen lang. Werden die fest verbundenen Bestandteile zu lang, entsteht eine hässliche Lücke am rechten Rand.
    Beispiele für die sinnvolle Verwendung:
    • Zahlenangaben mit Einheitensymbol: 120&nbsp;kg
    • zusammengehörende Begriffe: Wilhelm&nbsp;I.
    • Abkürzungen: z.&nbsp;B.
Zwischen einer Ziffer und einem Prozentzeichen sowie innen in Guillemets «…» (französische Ausrichtung) setzt die Wiki-Software seit 2007[10] automatisch ein geschütztes Leerzeichen.
Innerhalb eines unbetitelten Wikilinks kann das &nbsp; benutzt werden; es wird bei der Bildung der HTML-Verlinkung aufgelöst.[11]
Es ist eine technische Erweiterung in Arbeit, die in den Standardfällen falsche Zeilenumbrüche automatisch verhindern und händisch eingefügte geschützte Leerzeichen überflüssig machen soll.
  • Gelegentlich müssen Zeichen der Wikisyntax in bestimmten Texten oder Syntaxcodes unwirksam gemacht werden; so ist &#93; eine Umgehung, wenn in einer URL keine Klammer ] vorkommen kann und %5D wegen möglichem Unverständnis auf Seiten älterer Webserver nicht sicher funktioniert.
    • &amp; kann erforderlich werden, um ein Entity zu beschreiben.
    • Früher einmal gab es nicht standardisierte, praktisch Wiki-eigene Namen für Entitäten der Wikisyntax: &lsqb; &rsqb; &lcub; &rcub; für [ ] { } – dies wurde nicht mehr unterstützt.
    • Allgemein wird nur eine in HTML.4 (Stand 1998) gültige Definition in ein einzelnes Zeichen umgesetzt; ansonsten die Zeichenkette des Quelltextes angezeigt.
    • Der Name &apos; für den ASCII-Apostroph ' gehört zu XML/XHTML und wird verstanden.
  • &shy; für ein weiches Trennzeichen ist im Allgemeinen unerwünscht; es verhindert Suchvorgänge und irritiert im Quelltext; nur wenige Autoren sind damit vertraut.
  • Alle anderen Verwendungen sind außerhalb von Vorlagenprogrammierung und dergleichen unerwünscht.
    • Gelegentlich hat man keine andere Möglichkeit, besondere Zeichen über die Tastatur einzugeben. Hier kann man im Bearbeitungsfeld das Zeichen über die Nummer eingeben; anschließend die Vorschau anzeigen, prüfen ob es das richtige Zeichen geworden ist, und durch C&P im Wikitext ersetzen. Bei exotischen Zeichen ist jedoch immer abzuwägen, ob es auch bei allen Anwendern dargestellt werden kann; oder ob alternativ ein gebräuchlicheres Zeichen verwendet werden könnte. Will man einen arabischen Namen zusätzlich in der Originalsprache nennen, ist es in Ordnung, wenn die Zeichen bei einigen Benutzern nicht dargestellt werden können; wer arabisch lesen kann, wird auch geeignete Zeichensätze installiert haben.
    • Einige Benutzer, Skripte und Bots ersetzen gelegentliche Restvorkommen automatisiert.

Benannte Entities werden von der MW-Software[7] automatisch in numerische (dezimale) Entities umgesetzt, so dass der entstehende HTML-Text völlig unabhängig von unzulänglichen Browsern ausgeliefert wird.

Siehe auch

[Bearbeiten]
Projektseiten
[Bearbeiten]
  • HTML vermeiden – Mit HTML-Tags sollte man sparsam umgehen. Dieser Artiekl klärt dazu etwas auf.
Mediawiki
[Bearbeiten]

Anmerkungen

[Bearbeiten]
  1. Einige Benutzer, die HTML5 nicht richtig verstanden haben, behaupten, bei <br /> würde es sich um ungültige oder veraltete Syntax in HTML5 handeln.
    • Das ist schlicht falsch.
    • Siehe HTML5, W3C Recommendation, 14 December 2017, Abschnitt 8.1.2.1. Start tagsthen there may be a single U+002F SOLIDUS character (/) betreffend void-Elemente.
    Die Autorenschaft der deWP ist seit anderthalb Jahrzehnten an diese Syntax gewohnt und wendet die gleiche Logik auf <references /> an.
    • Mit oder ohne Schrägstrich ist jeweils eine von zwei in HTML gleichberechtigten gültigen Schreibweisen. Nirgendwo ist in HTML vorgeschrieben, dass nunmehr der Schrägstrich nicht mehr erlaubt, veraltet, inkompatibel oder sonstwas wäre, oder dass eine dieser beiden Notationen für HTML zu bevorzugen wäre.
    • Es gibt deshalb keinerlei Anlass, irgendetwas an der den Autoren vertrauten einheitlichen Notation für alle void-Elemente zu verändern.
  2. 1 2 Entsprechende Seiten werden in Kategorie:Wikipedia:Seite mit problematischem HTML-Tag eingeordnet. Es ist zu erwarten, dass zuküftig weitere Restriktionen einen syntaktisch korrekten und damit eindeutigen Wikitext einfordern, namentlich das Schließen aller geöffneten Elemente und eine Warnung bei leeren HTML-Elementen, die weder Inhalte noch Attribute besitzen und deshalb sinnfrei sind.
  3. Bis etwa 2015 wurden nur englischsprachige Buchstaben a–z A–Z sowie Ziffern als Bestandteile eines Wortes erkannt
  4. <gallery showfilename> ist einer der wenigen Ausnahmefälle.
  5. Siehe etwa WP:CSS #lang und Hilfe:Schriftunterstützung.
  6. phab:T2671 (Bugzilla:671 #c37)
  7. 1 2 includes/parser/Sanitizer.php – dies übernimmt auch unerwünschtes CSS sowie die Umwandlung benannter Entities und die Entfernung von Kommentaren.
  8. Wenn man eine URL als background vereinbaren könnte, würde bei jedem Aufruf jeder entsprechenden Seite automatisch eine Anfrage an den externen Server ausgelöst werden, durch die diesem verraten würde, welche Benutzer mit welcher IP und welchem Browser und ggf. welchen Cookies der externen Domain wann welche Wiki-Seite lesen. Die Cookies können zur Zuordnung identischer Browserprofile unter wechselnden IP genutzt werden.
    In einem Wiki ist es eine bewusste Entscheidung des Lesers, ein externes Link anzuklicken; automatischer Serverkontakt erfolgt nur innerhalb der WMF oder durch selbst veranlasste Konfiguration.
    Aus dem gleichen Grund werden Bilder nur von Servern der WMF in der Seite dargestellt.
  9. phab:T2671 (Bugzilla:671)
  10. Projektneuheiten 2007
  11. Durch einen seit 2005 bestehenden Software-Fehler (phab:T4700 (Bugzilla:2700)) geschieht das nicht innerhalb von Tag-Extensionen, also etwa durch <ref> eingeschlossen.