Vorlage Diskussion:SortKey

Aus Perrypedia
Wechseln zu: Navigation, Suche

Vorlage:SortKey - »°« ein Sonderzeichen?

Wurde unter Benutzer_Diskussion:NAN#Vorlage:SortKey - »°« ein Sonderzeichen? (im Sinne von, muss ersetzt werden) diskutiert.
Ergebnis: Falls Bedeutung "Grad" nicht und in dem gegebenen Beispiel BD 12° 4523 auch nicht. --NAN (Diskussion|Beiträge) 05:17, 28. Okt. 2013 (CET)

Version 1.3

Version 1.3 ist fertig.
Es werden nun auch »ein« und »eine« an das Ende der Zeichenkette gestellt (siehe Benutzer Diskussion:JoKaene#PPDefaultsort)
Ansonsten verhält sich die Vorlage weiterhin so, wie im Abschnitt »Version 1.2« beschrieben. --NAN (Diskussion|Beiträge) 10:50, 1. Nov. 2012 (CET)

Version 1.2

Version 1.2 ist fertig.
Es wurden zwei weitere Sonderzeichen hinzugefügt, die Aufgrund des Artikels Jiří Pondělíček beachtet werden müssen.
Außerdem wurde das Problem behoben, dass teilweise durch das Löschen von Sonderzeichen doppelte Leerzeichen im Sortkey stehen. Diese konnten bisher nicht auf ein einzelnes gekürzt werden (zumindest wurde keine Möglichkeit entdeckt, das mit der ParserFunction replace zu machen). Nun übernimmt das die Vorlage:TrimFirstDouble. Die Funktion wird fünf mal hintereinander ausgeführt, das genügt für alle aktuell existierenden Artikel. Noch mal insgesamt zusammengefasst, was die Vorlage (und damit auch die diese nutzende Vorlage:PPDefaultsort kann:

  • Zeichen entfernen: '-!–"&()*,./:?’“„«»·
  • Zeichen ersetzen durch »Grundform« (z.B. á -> a): áÁàâÂäÄãčçÇéÉèÈêëěíÎïÑóÓôöÖõřšßťúÚûÛüÜý
  • Erstes Zeichen groß.
  • Alle Zeichen nach dem ersten klein.
  • Einleitende »Der«, »Die«, »Das« mit Komma getrennt an das Ende stellen.
  • Bis zu maximal fünf doppelte Leerzeichen zu einfachen Leerzeichen kürzen.

Damit werden aktuell die Vorgaben für die Standardsortierung erfüllt. Folgende Aspekte bleiben offen:

  • Sortierung von Namen: Könnte man sich inzwischen einen Ansatz vorstellen, bei dem immer der letzte Namensbestandteil an den Anfang gestellt wird. Ähnlich wie aktuell »Der«, »Die« und »Das« an das Ende gestellt werden. Wird aber durch Sachen wie den Begriffsklärungszusatz erschwert, wäre außerdem nicht bei allen Namen anwendbar. Wenn man so etwas machen wollte, würde es außerdem eher in eine eigene Vorlage gehören. Aktuell müssen die betroffenen Kategorien manuell gepflegt werden.
  • Sortierung in Verbindung mit Zahlen: Sehe ich aktuell beim gewählten Ansatz keine Möglichkeit. Muss weiter - wie bisher auch schon - manuell eingepflegt werden.

--NAN (Diskussion|Beiträge) 13:36, 13. Mai 2012 (CEST)

Mögliche Verbesserung für eine weitere Version: Wenn man erst den gesamten Seitennamen in Kleinbuchstaben umwandelt und dann erst die Ersetzung macht, könnte man ein paar vardefines einsparen (aber Vorsicht: man kann nicht einfach alle Ersetzungen von Großbuchstaben rausnehmen z.B. »Ñ« kommt aktuell nur als Großbuchstabe vor, müsste dann durch Ersetzung des »ñ« ersetzt werden).
Theoretisch würde das etwas Performance bringen, praktisch sind aktuell keine Performance-Probleme bekannt, besteht also auch kein Grund, sich die Arbeit zu machen. --NAN (Diskussion|Beiträge) 14:08, 13. Mai 2012 (CEST)

Leerzeichen

Durch Poldis Bemerkungen in dieser Diskussion habe ich noch einmal auf die Auswirkungen von Leerzeichen bei der Sortierung beobachtet. Resultat: Sie verhalten sich wie Sonderzeichen. (zum Beispiel hier, zweiter und dritter Eintrag bei »L«). Es sind seltene Fälle, aber sie existieren.
Ist es möglich, Leerzeichen als zu entfernendes Zeichen in die Vorlage aufzunehmen? Wenn »Ja« und wir es tun (ich wäre dafür) ergeben sich daraus weitere Konsequenzen, die jedoch automatisiert erledigt werden könnten. Doch dazu zu gegebener Zeit. --JoKaene 16:30, 23. Apr. 2012 (CEST)

Würde ja eher sagen, dass sich Leerzeichen wie alle anderen Zeichen (z.B. a, b, c, ...) verhalten: Sie werden sortiert, was ja auch schon eine Weile bekannt ist (siehe z.B. Hilfe:Kategorien#Sortierung von Oberbegriffen oder Vorlage_Diskussion:SortKey#Nachfrage)?
Ist es technisch möglich, die Leerzeichen zu entfernen? Nicht auf die Art, mit der die Sonderzeichen entfernt werden. Könnte mir aber ein komplizierteres, den Server stärker belastendes Vorgehen vorstellen, dass wahrscheinlich zum gewünschten Ergebnis führt.
Ist es fachlich sinnvoll?
Ich denke nicht.
Bei Sonderzeichen wie z.B. »'« leuchtet mir das nicht beachten für die Sortierung ein: Wurde ja in der ursprünglichen Diskussion erklärt. Führt dazu, dass sich der Begriff in der Liste an einer Stelle befindet, an dem ich ihn erwarte. Verhindert, dass sich der Begriff in der Liste an einer Stelle befindet, an der ich ihn zunächst nicht erwarten würde.
Leerzeichen sind für mich aber Bedeutung tragende Zeichen wie a-z und 0-9. Insofern passt meiner Meinung nach auch die jetzige Sortierung, die halt auf den Zeichen a-z, 0-9 und dem Leerzeichen aufbaut.
Insofern: Bin gegen ein nicht-beachten der Leerzeichen für die Sortierung. --NAN 17:53, 23. Apr. 2012 (CEST)
PS: Müsste die gesamte Diskussion nicht drüben bei Hilfe:Kategorien stehen? Von mir aus kann der Inhalt der Diskussion dorthin verschoben werden. --NAN 17:53, 23. Apr. 2012 (CEST)
Der Server hat durchaus noch Reserven. Wir bringen den Server nicht mal ansatzweise ins Schwitzen. Das Leerzeichen vor den alphanumerischen Zeichen kommt ist leider immer so. Daher war ich ja auch so überrascht das wir die Leerzeichen beibehalten. Mit Leerzeichen kommt Tal des Todes VOR Talar. Aber wenn es keine technische Lösung gibt, dann ist da ebenso. --Poldi 18:07, 23. Apr. 2012 (CEST)
Ich habe die Diskussion hier eingestellt, weil es mir zunächst einmal darum ging, ob ein Ausschluss von Leerzeichen technisch in der gleichen Weise wie bei anderen Zeichen möglich ist. Dem ist offenbar nicht so und damit hat sich der Rest eigentlich schon erledigt. Da ich an einer anderen Stelle gesehen habe, dass die Beachtung von Leerzeichen auch Vorteile bringt (Kategorie:Perry Rhodan-Heftromane die mit »Auf...« beginnen), schließe ich das Thema für mich hier wieder. --JoKaene 18:22, 23. Apr. 2012 (CEST)
@Poldi, in Deinem Beispiel sind die ersten drei Buchstaben gleich, dann wird das Leerzeichen mit dem a verglichen, dass Leerzeichen kommt zuerst, würde ich auch so erwarten und halte ich für richtig.
@JoKaene, wie oben geschrieben, technisch wahrscheinlich möglich. Von Poldi ergänzt, dass wahrscheinlich kein Problem für den Server. Denke, damit ist das zunächst eine rein fachliche Frage. Aber für mich natürlich auch o.k., wenn Du inzwischen meine Meinung teilst. ;-) --NAN 19:29, 23. Apr. 2012 (CEST)
@NAN, Deine Meinung teile ich jetzt zu höchstens 99%. ;-) Denn Deine Argumente lassen mich stark vermuten, dass ich mit meiner Auffassung zum gewünschten Sortierverhalten falsch lag. --JoKaene 19:46, 23. Apr. 2012 (CEST)
Ok. Dann noch ein fiktive Beispiel. Der Name Tal ter Schad kommt auch vor Talar. Aber die Diskussion hatten wir schon mal. Natürlich kann man mit einem gewissen Vorwissen Dinge erwarten. Zu wissen, dass Tal ter Schad ein Leerzeichen nach »Tal« und eines nach »ter« hat, gehört mach meiner Meinung nicht dazu. Zu wissen, dass der ASCII-Code von » « vor »a« und somit das Leerzeichen vor a sortiert wird, denke ich, kann man auch nicht voraussetzen. Aber wie gesagt. Gibt es keine technische Lösung zur Ersetzung bleibt es so wie es jetzt ist. Dafür habt ihr zu viel Arbeit in die Sortierung gesteckt. --Poldi 20:21, 23. Apr. 2012 (CEST)
Der Beispiele gibt es sicher viele, aber ich glaube, wir argumentieren nur gefühlsmäßig. Ich werde mal versuchen, herauszubekommen, wie »offiziell« mit dem Leerzeichen umgegangen wird. Eilig ist es sowieso nicht. --JoKaene 20:35, 23. Apr. 2012 (CEST)
Poldi, wenn man nicht weiß, ob ein Lemma aus einem oder mehreren einzelnen Wörtern besteht (sprich: ob Leerzeichen zwischen den Begriffen stehen), dann tut man sich tatsächlich etwas schwerer, den Begriff zu finden.
Dann wiederum: Dieses Wissen fehlt einem genau dann, wenn man den Begriff nicht gerade gelesen hat, sprich, aus dem Gedächtnis sucht. Aber dann weiß man auch nicht, ob der mittlere Namensbestandteil »der«, »ter« »ther« oder so ähnlich geschrieben wird. Das Suchen in einer Liste ist in so einem Fall ganz unabhängig von Leerzeichen und der Sortierung etwas schwieriger.
Das Leerzeichen vor den anderen Buchstaben zu erwarten, hat für mich nichts mit ASCII, also der Software zu tun. Ein Platz ohne Zeichen, also ein Leerzeichen, kommt für mich persönlich halt vor einem Platz mit einem Zeichen. Eine umgekehrte Sortierung käme mir jetzt irgendwie seltsam vor.
JoKaene, denke aber, Du hast recht: Wenn es eine offizielle Regelung gibt, dann sollten wir die einfach verwenden. --NAN 20:59, 23. Apr. 2012 (CEST)
Bisher habe ich nur Hinweise im Netz gefunden, die NANs Ansicht bestätigen. Deshalb habe ich einfach mal in Word einige Versuche unternommen. Diese ergaben eine identische Sortierfolge wie sie aktuell auch mit der Sortkeyvorlage erzwungen wird. Sie ist also ASCII-unabhängig, da Sonderzeichen ebenfalls ignoriert werden. Ich bin deshalb jetzt überzeugt, dass wir das Leerzeichen nicht weiter berücksichtigen müssen. --JoKaene 21:18, 23. Apr. 2012 (CEST)

Version 1.1

Version 1.1 ist fertig. An Funktionalität ist hinzugekommen, dass einleitende Artikel an das Ende gestellt werden. Außerdem wurde zwischenzeitlich die extra Regel bezüglich Raumschiffen und Raumschiffsklassen entfernt, ist also kein offener Punkt mehr. Daher noch mal insgesamt zusammengefasst, was die Vorlage (und damit auch die diese nutzende Vorlage:PPDefaultsort kann:

  • Zeichen entfernen: '-!–"&()*,./:?’“„«»·
  • Zeichen ersetzen durch »Grundform« (z.B. á -> a): áÁàâÂäÄãčçÇéÉèÈêëíÎïÑóÓôöÖõšßťúÚûÛüÜý
  • Erstes Zeichen groß.
  • Alle Zeichen nach dem ersten klein.
  • Einleitende »Der«, »Die«, »Das« mit Komma getrennt an das Ende stellen.

Damit werden aktuell die Vorgaben von Sortierung von Zeichen und Sortierung bei Begriffen mit einleitendem_Artikel erfüllt. Folgende Aspekte bleiben offen:

  • "Test - test", ""Test & test" oder ähnlich: Bei allen Zeichen, die entfernt werden ergibt sich das Problem, dass je nach Anordnung im Text nach der Entfernung zwei Leerzeichen aufeinander folgen. Ist in der Hilfe nicht festgehalten, beeinflusst aber die Sortierung und wurde bei der aktuell laufenden Umstellaktion immer so gelösst, dass das doppelte Leerzeichen durch ein einfaches ersetzt wird. Wäre etwas für eine Version 1.2.
  • Sortierung von Namen: Sehe ich aktuell beim gewählten Ansatz keine Möglichkeit. Müsste weiter - wie bisher auch schon - manuell eingepflegt werden. Aber: Nur für die beiden Kategorien. Alle anderen Kategorien könnten per Vorlage und DefaultSort mit dem korrekten Sortkey versorgt werden.
  • Sortierung in Verbindung mit Zahlen: Sehe ich aktuell beim gewählten Ansatz keine Möglichkeit. Müsste weiter - wie bisher auch schon - manuell eingepflegt werden.

--NAN 19:49, 10. Apr. 2012 (UTC)

Nachfrage 2

Sehe ich es eigentlich richtig, dass {{SortKey}} nur für einzelne Kategorien eingesetzt werden kann und erst {{PPDefaultsort}} alle dem Artikel zugehörigen Kategorien gleichermaßen behandelt? --JoKaene 08:53, 9. Apr. 2012 (UTC)

Ja, genauso ist es. Wenn ich das richtig sehe, wird PPDefaultsort in "Standardfällen" verwendet, und Sortkey, wenn Sonderfälle auftreten, z.B. Sortierung gemäß Nachname, Vorname in der Kategorie:Personen, wobei die spezielle Sortierung in der Personenkategorie manuell eingetragen wird, und alle anderen Kategorien mit SortKey sortiert werden. --Andi47 09:56, 9. Apr. 2012 (UTC)
Kleine Ergänzung: Sehe aktuell nur zwei Einsatzszenarien für die Vorlage SortKey:
  • Als wichtiger Bestandteil von Vorlage:PPDefaultsort, das ohne nicht funktionieren würde.
  • Wenn ein Artikel mit vorangestelltem Leerzeichen ganz an den Anfang einer Kategorie-Liste geschoben werden soll z.B. [[Kategorie:Planeten| {{SortKey}}]]
--NAN 12:27, 9. Apr. 2012 (UTC)

Nachfrage

Ein Punkt der unten aufgeführten Möglichkeiten ist mir nicht ganz klar. Was würde die Vorlage bei einem Lemma wie "Test - test" eigentlicht tun? --JoKaene 19:38, 6. Apr. 2012 (UTC)

Die Vorlage ersetzt - durch nichts und somit kommen zwei Leerzeichen direkt hintereinander. --Poldi 19:44, 6. Apr. 2012 (UTC)
Ich bin mir zwar noch immer nicht ganz sicher, aber ich glaube, dass die Software eine Leerzeichen genauso handhabt wie gar kein Zeichen. Dann wäre die Vorlage also auch in solchen Fällen einsetzbar. --JoKaene 19:50, 6. Apr. 2012 (UTC)
Grade getestet: Die Software unterscheidet doch. Muss noch mal grübeln. --JoKaene 19:57, 6. Apr. 2012 (UTC)

Aufgrund einer Eintragung an anderer Stelle: Bei Begriffen mit Zahlen funktioniert Sortkey doch normal, wenn die Zahl nicht den Kriterien der Hilfe:Kategorien-Seite unterliegt, oder? Also etwa bei »Saboteure in A-1« --JoKaene 06:38, 7. Apr. 2012 (UTC)

Jein. ;-)
Klar funktioniert die Vorlage, sie kann aber nicht erkennen, ob da jetzt "Saboteure in a001" geschrieben gehört und liefert daher immer nur "Saboteure in a1".
Was ist einfacher zu erklären/vermitteln: "Titel mit Zahl immer ohne die Vorlage und Stellen mit 0 auffüllen" oder "Titel mit Zahl immer ohne die Vorlage und Stellen mit 0 auffüllen, außer die Ausnahme trifft zu und man muss keine 0 einfügen, dann {{PPDefaultsort}}."
Habe den Eindruck, in der Wahrnehmung von Leuten, die sich nicht so intensiv mit dem Thema beschäftig haben, verkompliziert jede Ausnahme, insbesondere wenn noch irgendwas mit geschweiften Klammern dabeisteht, die Sache nicht nur etwas, sondern sogar wesentlich...
(Das bitte nicht als Kritik an irgendwem auffassen. Denke nur, die Regeln sollten nicht nur so kompliziert wie nötig, sondern gleichzeitig so einfach zu verstehen wie irgend möglich sein. ;-) ) --NAN 07:35, 7. Apr. 2012 (UTC)
Eigentlich sehe ich die Hilfe in diesem Fall als sehr klar und eindeutig gefasst (vor allem durch den Einleitungssatz). Entscheidend für mich ist deshalb nur, dass die Vorlage in einem Fall wie oben funktioniert. --JoKaene 07:54, 7. Apr. 2012 (UTC)
Noch steht ja nichts von irgendwelchen Vorlagen in der Hilfe?
Vielleicht sollten wir einfach, sobald die ganze Sache mal stabil ist, die Kollegen aktiv fragen, die sich hier zu Wort gemeldet haben. So in der Art "Ist Euch klar, wann welche Vorlage genutzt werden soll und wann nicht.".
Dass uns das Ganze nachdem wir seit Tagen (oder sind es inzwischen schon Wochen?) an dem Thema dran sind, klar ist und uns die Beschreibung verständlich vorkommt würde ich halt einfach nicht überbewerten. Und wenn es helfen sollte - muss man natürlich erst sehen - in einem Spezialfall (keine zusätzliche 0) eines Spezialfalls (Zahlen) einfach auf die Erwähnung der Vorlage zu verzichten, hätte ich da jetzt auch keine Bauchschmerzen. --NAN 10:14, 7. Apr. 2012 (UTC)
Von der Vorlage steht ja nur aus dem einen Grund nichts in der Hilfe, weil eben noch nicht klar ist, ob sie stabil läuft. Siehe auch Hilfe Diskussion:Kategorien#Nutzung der Sortkey-Vorlagen. Ich habe nur noch kein entsprechendes Feedback erhalten. --JoKaene 11:00, 7. Apr. 2012 (UTC)
Habe Poldi mal direkt gefragt und falls/wenn dann die Hilfe umgeschrieben ist kann man wohl auch besser darüber diskutieren ob der Spezialfall des Spezialfalls mit den Zusatzinfos bezüglich Vorlage immer noch leicht verständlich ist, oder auch nicht. ;-) --NAN 11:13, 7. Apr. 2012 (UTC)
Ich denke, dass die Vorlage verwendet werden kann. Leider habe ich keinen direkten Vergleich vor dem Einsatz der Vorlage, aber unser Server liegt im Tagesmittel bei 90% Idle. D.h. , er langweilt sich. In der Spitze geht der Wert schon mal runter auf 70%, was aber immer noch kein Problem darstellt. --Poldi 12:40, 7. Apr. 2012 (UTC)

Version 1.0

Erkläre mal einfach ganz frech den aktuellen Stand als Version 1.0. Hauptsächlich, um eine Überschrift für einen Statusbericht zu haben. ;-) Hoffe, Poldi, als Ersteller der Vorlage nimmt mir das nicht allzu krumm. :-)
Was kann die Vorlage?

  • Zeichen entfernen: '-!–"&()*,./:?’“„«»·
  • Zeichen ersetzen durch »Grundform« (z.B. á -> a): áÁàâÂäÄãčçÇéÉèÈêëíÎïÑóÓôöÖõšßťúÚûÛüÜý
  • Erstes Zeichen groß.
  • Alle Zeichen nach dem ersten klein.

Damit wird in Version 1.0 die aktuelle Vorgabe unter Hilfe:Kategorien#Sortierung von Zeichen erfüllt. Folgende Aspekte bleiben offen:

  • "Test - test": Bei allen Zeichen, die entfernt werden ergibt sich das Problem, dass je nach Anordnung im Text nach der Entfernung zwei Leerzeichen aufeinander folgen. Ist in der Hilfe nicht festgehalten, beeinflusst aber die Sortierung und wurde bei der aktuell laufenden Umstellaktion immer so gelösst, dass das doppelte Leerzeichen durch ein einfaches ersetzt wird. Wäre etwas für eine Version 1.1.
  • Hilfe:Kategorien#Sortierung bei Raumschiffen und Raumschiffsklassen: Könnte recht einfach durch eine zweite Vorlage gelöst werden. Eventuell könnte man die Vorlagen auch verschachteln: Die aktuelle Vorlage ohne die Änderung der Groß-/Kleinschreibung als Basis und zwei abgeleitete Vorlagen, die zunächst die Zeichenersetzungen per Basis-Vorlage ausführen und dann die Groß-/Kleinschreibung anpassen. Alternativ könnte man der aktuellen Vorlage einen Parameter geben, und am Ende per "if" entscheiden, wie die Groß-/Kleinschreibung aussehen soll. Ist aber in der Praxis vielleicht weniger bequem? Version 1.1 oder 1.2? ;-)
  • Hilfe:Kategorien#Sortierung von Namen: Sehe ich aktuell beim gewählten Ansatz keine Möglichkeit. Müsste weiter - wie bisher auch schon - manuell eingepflegt werden. Aber: Nur für die beiden Kategorien. Alle anderen Kategorien könnten per Vorlage und DefaultSort mit dem korrekten Sortkey versorgt werden.
  • Hilfe:Kategorien#Sortierung in Verbindung mit Zahlen und Hilfe:Kategorien#Sortierung bei Quellen: Sehe ich aktuell beim gewählten Ansatz keine Möglichkeit. Müsste weiter - wie bisher auch schon - manuell eingepflegt werden.

Trotz der Einschränkungen: Denke die Vorlage ist insbesondere in Kombination mit DefaultSort bereits jetzt eine sehr hilfreiche Sache. Schlage von daher vor, die Kombination "DefaultSort/SortKey" in eine mit passendem Namen versehene weitere Vorlage zu packen (z.B. "PPDefaultSort"?) und dann für diese Lösung Performance-Tests zu fahren. :-) --NAN 06:16, 1. Apr. 2012 (UTC)

Zusammenarbeit?

Auch wenn die Vorlage aktuell lediglich getestet wird:
Wäre nicht aktive Zusammenarbeit angebracht (gewesen)? Die Leute, die in dem Bereich aktuell tätig sind, sind schließlich bekannt. Und es wäre doch irgendwie seeehr ungünstig, wenn, nachdem jetzt mehrere tausend edits gemacht wurden, die gleich Anzahl edits erneut nötig wäre, um die Vorlage einzupflegen. Aber vielleicht existiert ja auch ein bot, der verwendet werden könnte? Aber wieder die Frage nach der Zusammenarbeit: An anderer Stelle wurde nach so einem bot gefragt...
Um mal einen ersten Schritt Richtung Zusammenarbeit zu machen: Als ich das letzte mal eine Auswertung diesbezüglich gemacht hatte, kamen folgende Sonderzeichen in den Artikel-Namen vor:

  • Zu entfernen:'-–!"&()*,./:?’“„«»·
  • Zu ersetzen:áÁàâÂäÄãčçÇéÉèÈêëíÎïÑóÓôöÖõšßťúÚûÛüÜý

Meine Meinung ohne Messwerte zu kennen: Es dürfte seeehr stark in die Performance gehen, all diese Ersetzungen per magic words zu machen. Günstiger wäre wahrscheinlich, eine Extension zu schreiben, in der dann auch weitere Ersetzungen wie römische Zahlen oder Namensumstellungen erledigt werden könnten. Müsste nur jemand die Zeit investieren, sich die nötigen Kenntnisse beizubringen und dann anzuwenden...
Aber nun, ohne Messwerte Aussagen über Performance zu machen ist immer schlecht: Also ich bin durchaus neugierig, wie sich der Ansatz hier in der Praxis beweist. Falls er funktioniert halt nur einfach schade um die viele Arbeit, die bereits in das sortkey-Thema geflossen ist... --NAN 19:40, 29. Mär 2012 (UTC)

Ich kann mich deiner Ausführung bzgl der Vorlage nicht anschließen. Ich persönlich glaube nicht, dass ich die Vorlage jemals fertig bekomme. Für mich ist es mehr eine Spielerei mit den ParserFunctions. Für den unwahrscheinlichen Fall das es doch mal eine Vorlage SortKey geben sollte, ezeugt die Verwendung keine Serverlast. Die Vorlage wird beim Speichern des Artikels aufgelöst. Das Ansehen des Artikels erzeugt keine zusätzliche Last. Wenn die Vorlage als solches geändert wird, dann ändert die Wiki-Software alle Artikel automatisiert über die Jobqueue. Zum Thema Bot. Es wäre schön, wenn wir wieder einen hätten. Ich hab leider keinen brauchbaren. Aber Du bist doch vom Fach ;-) Schreib doch einen ;-)) --Poldi 19:57, 29. Mär 2012 (UTC)
Funktionieren Sachen wie Zyklusstatistiken nicht genau deshalb, weil der cache ausgeschaltet wurde und dadurch bedingt die ParserFunctions immer wieder und wieder ausgeführt werden? Das wäre hier anders?
Wie geschrieben: Wenn Messwerte zeigen, dass das kein Problem ist, dann ist das ja gut. Ist aber halt ein Bereich, bei dem man meiner Meinung nach besser vor einer Umstellung von tausenden Artikeln sicher sein sollte, dass das mit der Performance passt.
Aber nun, wenn Du mit der Vorlage ohnehin nur spielst, erledigt sich ja auch automatisch das Thema... --NAN 20:06, 29. Mär 2012 (UTC)
Ich habe mir zwischenzeitlich mal die Vorlagen zu Sortkeys in der Wikipedia angesehen. Leider hat es mir nicht geholfen, davon verstehe ich zu wenig. Aber vielleicht hilft es Dir, Poldi!? --JoKaene 20:09, 29. Mär 2012 (UTC)
@NAN Falls die Vorlage jemals funktionieren wird, dachte ich an eine Verwendung über subst. Dann sieht man das Ergebnis direkt im Artikel. --Poldi 20:27, 29. Mär 2012 (UTC)
Verstehe. Damit erledigt sich das Performance-Problem. Sehr gute Idee. :-)
Habe auch wenig Zweifel, dass die Vorlage funktionieren wird, sehe da Deine Bedenken nicht? --NAN 19:48, 30. Mär 2012 (UTC)
Ich hab keine Zweifel an der Programmierung. Ich hab mehr Zweifel am Algorithmus. Wie kann ein Programm entscheiden ob die Ziffernfolge iv nun römisch vier oder die Abkürzung für Individualverformer ist? Auch das Problem mit den führenden Nullen, beispielsweise wird aus 101 NGZ 0101 NGZ ist noch eine Überlegung wert. Bei der Jahreszahl könnte ich mir einen Parameter ähnlich printf vorstellen. Aber wie gesagt, ich bin da eher pessimistisch. --Poldi 20:03, 30. Mär 2012 (UTC)
Nun, dieses Problem mit dem gewählten Ansatz zu lösen ist wahrscheinlich wirklich nicht möglich. Also wird die Vorlage nicht perfekt sein.
JoKaene und Klenzy haben in letzter Zeit ein paar tausend edits gemacht. Bei jedem edit Artikelname mehrfach kopiert, Sonderzeichen ersetzt, Groß-/Kleinschreibung angepasst.
Die Alternative, die Dein Ansatz bietet (die Vorlagen-Idee etwas weitergesponnen), ist, einfach am Ende des Artikels {{PPDefaultSort}} einzufügen. Bei mehreren tausend Seiten wäre damit die Sache getan.
Was ich sagen will: Die Vorlage muss nicht perfekt sein, um eine sehr große Erleichterung zu bringen.
Dann sind halt die Zahlen und wahrscheinlich auch die Raumschiffe und Personen (und selbst da kann Deine Vorlage zu einem gewissen Grad helfen) weiter ein Sonderfall, der manuell nachgepflegt werden muss: Keine Verschlechterung zu jetzt.
Aber: Bei seeeehr vielen anderen Seiten wird die Sache seeeehr viel einfacher. --NAN 20:26, 30. Mär 2012 (UTC)
Kann es sein, dass uns bezüglich »subst« ein Denkfehler unterlaufen ist?
Habe mal testweise die unter http://www.mediawiki.org/wiki/Manual:Substitution beschriebene Substitutionsmöglichkeit angewendet: [1]
Zwei Sachen sind mir aufgefallen:
  • Der Seitenaufruf wird bei einfacher Anwendung einfach durch den "Quellcode" ersetzt, sprich, der erhoffte Performance-Vorteil ist in diesem Fall noch nicht gegeben. Kann man umgehen, indem man zusätzlich in der Vorlage selbst entsprechend mit subst/safesubst arbeitet. Nur in der Vorlage damit zu arbeiten würde wiederum wahrscheinlich keine Performance-Vorteil bringen, da dann die Vorlage immer noch bei jedem Seitenaufruf ausgewertet würde?
  • Es ist zumindest für mich als Nutzer wirklich »kein« Hinweis mehr auf die Substitution im Quellcode zu sehen: Funktioniert dann wirklich die Anpassung der Seiten bei Änderung der Vorlage durch die Jobqueue?
Führt also eventuell zu einer Wahl zwischen: subst verwenden, aber dann reagiert die Sache nicht auf Vorlagenänderungen (den Effekt könnte man mit einem bot natürlich abmildern, aber da haben wir ja keinen).
Oder auf subst verzichten, messen, wieviel Performance das kostet und eventuell einfach damit leben? --NAN 04:10, 31. Mär 2012 (UTC)
Bisher decken sich unsere Erkenntnisse, leider. Die Anpassung per Job habe ich in der Doku gelesen. Nachgestellt hab ich es aber noch nicht. Vielleicht sollten wir mal ein paar 100 Seiten umstellen und sehen wie es ausgeht? BTW Ich hab die ersten Schritte mit dem AutowikiBrowser unternommen. Vielleicht kann man damit etas anfangen. --Poldi 08:47, 31. Mär 2012 (UTC)
Denke auch, dass das ein guter Weg ist: Erst mal bei ein paar 100 Seiten ausprobieren, prüfen, welche Auswirkungen das hat. Eventuell noch etwas an der Vorlage schrauben. Falls die Performance-Belastung im vernachlässigbaren Bereich bleibt, muss ja auch nicht mit subst gearbeitet werden.
AutowikiBrowser wollte ich mir auch schon mal anschauen. War bei mir zeitlich aber bisher nicht drin. Hatte allerdings den Eindruck, so etwas könnte für unsere QS-Leute eine seeehr große Hilfe sein. Es war Dir auf einfache Weise möglich, den AutowikiBrowser für unser Wiki zu nutzen? Bei dem ersten, zugegeben recht flüchtigen Blick auf die Software hatte ich den Eindruck, die sei fix codiert auf die große wiki festgelegt? --NAN 16:21, 31. Mär 2012 (UTC)
Vor einigen Monaten hatte ich den AWB absolut nicht zum laufen bekommen. Jetzt ging es ohne Probleme. Man beachte nur, dass api.php und index.php bei uns unter www.perrypedia.proc.org/mediawiki zu finden sind. Die Vorlage scheint dir zu gefallen. Freut mich seht, denn für mich war sie eigentlich nur als Spielwiese gedacht. Ich habe auf dem Server nun ein sar installiert, sodass wir die CPU-Belastung vor und nach dem Einsatz der Vorlage vergleichen könnten. --Poldi 19:26, 31. Mär 2012 (UTC)
Na ja, wenn die Vorlage schon mal im Hauptnamensraum steht und da sie ja durchaus nützlich sein kann, würde ich sie gerne »abrunden«.
Aktuell sehe ich noch einen offenen Punkt, was die Kernfunktionalität betrifft: Durch Artikelnamen wie z.B. "Test - test" entstehen sortkeys mit mehr als einem Leerzeichen. Erste Versuche doppelte Leerzeichen zu entfernen haben nicht geklappt: Wurden immer alle Leerzeichen entfernt, was falsch ist.
Vielleicht hast Du da ja noch eine Idee? --NAN 20:28, 31. Mär 2012 (UTC)
In anderen Sprachen oder Editoren ersetzte ich immer zwei Leerzeichen » « durch ein Leerszeichen » «. Hier muss du noch darauf achten, die Leerzeichen in einzuschließen. Vielleicht hilft dir das weiter? --Poldi 20:41, 31. Mär 2012 (UTC)
Leider nicht. Hatte da bereits verschiedene Variationen ausprobiert, jetzt noch mal, funktioniert nicht.
Aber nun vielleicht rutscht mir auch nur beständig irgendein kleiner Fehler rein?
Wäre auf jeden Fall schade, sollte das nicht funktionieren. --NAN 21:18, 31. Mär 2012 (UTC)
Diese und diese Änderung führen zu folgender Verbesserung:
Pagename:
NAN/Sonderzeichentest'-–!"&()*,./:?’“„«»·áÁàâÂäÄãčçÇéÉèÈêëíÎïÑóÓôöÖõšßťúÚûÛüÜýSonderzeichentest
Vorher:
Nansonderzeichentest#39;–#34;#38;aaaaaaaaccceeeeeeiîiñoooooossstuuuuuuysonderzeichentest
Nachher:
Nansonderzeichentest#39;#34;#38;aaaaaaaaccceeeeeeiiinoooooossstuuuuuuysonderzeichentest --NAN 18:45, 31. Mär 2012 (UTC)