Inhaltsangabe:Einleitung:
Im Internetportal der Stadt Nürnberg wurde in einer vorausgehenden Diplomarbeit eine Suchmaschine auf Basis des Produktes e:IAS der Fa. empolis GmbH realisiert. Diese Lösung soll in verschiedenen Bereichen verbessert und erweitert werden.
Es sollen aussagekräftige Logfiles generiert und ausgewertet werden, insbesondere sollen die Auswertungen mit denen der vorhergehenden Suchlösung vergleichbar sein.
Bei der Ergebnispräsentation sollen die Erfordernisse der Barrierefreiheit beachtet werden und die vorhandenen Templates entsprechende Anpassung erfahren.
Die Lösung soll um Ansätze semantischer Suche erweitert werden. Es ist angedacht die vorhandene Synonymverwendung auszubauen und um Taxonomien zu einem Theasurus zu erweitern. Dabei sollen verschiedene Möglichkeiten untersucht werden und eine Möglichkeit, mindestens prototypisch, integriert werden. Inhaltsverzeichnis:Inhaltsverzeichnis:
Kurzfassung2
Inhaltsverzeichnis3
Abbildungsverzeichnis6
Tabellenverzeichnis8
Formelverzeichnis8
1. Motivation9
2. Grundlagen10
2. 1Textbasierte Suche10
2. 2Taxonomien und Thesauri13
2. 2. 1Was sind Taxonomien und Thesauri13
2. 2. 2Semantische Suche mittels Thesauri17
2. 2. 3Taxonomiebasierte Ähnlichkeitsmaße18
2. 2. 3. 1Pfadlänge18
2. 2. 3. 2Normalisierte Pfadlänge19
2. 2. 3. 3Dichte des Zweigs19
2. 2. 3. 4Extended gloss overlaps measure20
2. 2. 3. 5Maß basierend auf Informationsgehaltswert des Konzepts20
2. 2. 3. 6Maß basierend auf knoten- und kantenbasierten Techniken21
2. 2. 3. 7Maß abgeleitet aus der Informationstheorie22
2. 2. 3. 8Vergleich22
2. 2. 4RDF-basierte Thesaurusrepräsentation: SKOS23
2. 3Barrierefreiheit von Webanwendungen30
2. 3. 1Allgemeine Regelungen31
2. 3. 2Rechtliche Regelungen33
3. Suchlösung der Stadt Nürnberg - der Ist-Stand34
3. 1Abacho35
3. 2E:IAS36
3. 2. 1Systemaufbau36
3. 2. 1. 1Indexierung37
3. 2. 1. 2Ergebnissauslieferung37
3. 2. 2Konfiguration38
3. 2. 3Such- und Indexierungsablauf38
3. 2. 4Verbesserungspotentiale44
4. Thesaurusbasierte Suche46
4. 1Ist-Stand46
4. 2Realisierte Systemerweiterungen46
4. 2. 1Ähnlichkeitsmaße in e:IAS46
4. 2. 1. 1Taxonomieähnlichkeitsmaß: Taxonomie46
4. 2. 1. 2Taxonomieähnlichkeitsmaß TaxonomiePfad51
4. 2. 2Mögliche Thesauri und Datenquellen52
4. 2. 2. 1WikiSaurus in Wiktionary53
4. 2. 2. 2OmegaWiki53
4. 2. 2. 3OpenThesaurus54
4. 2. 2. 4Getty Thesaurus of Geographic Names54
4. 2. 2. 5Projekt Deutscher Wortschatz54
4. 2. 2. 6HUGO55
4. 2. 2. 7GEMET Thesaurus56
4. 2. 2. 8Eurovoc Thesaurus57
4. 2. 3Beispielhafte Einbindung von [. . .]
Inhaltsverzeichnis
1;Barrierefreie und thesaurusbasierte Suchfunktion für das Webportal der Stadt Nürnberg;1 2;Kurzfassung;3 3;Inhaltsverzeichnis;4 4;Abbildungsverzeichnis;7 5;Tabellenverzeichnis;9 6;Formelverzeichnis;9 7;1 Motivation;10 8;2 Grundlagen;11 8.1;2.1 Textbasierte Suche;11 8.2;2.2 Taxonomien und Thesauri;14 8.2.1;2.2.1 Was sind Taxonomien und Thesauri;14 8.2.2;2.2.2 Semantische Suche mittels Thesauri;20 8.2.3;2.2.3 Taxonomiebasierte Ähnlichkeitsmaße;20 8.2.4;2.2.4 RDF-basierte Thesaurusrepräsentation: SKOS;25 8.3;2.3 Barrierefreiheit von Webanwendungen;32 8.3.1;2.3.1 Allgemeine Regelungen;33 8.3.2;2.3.2 Rechtliche Regelungen;35 9;3 Suchlösung der Stadt Nürnberg der Ist-Stand;37 9.1;3.1 Abacho;38 9.2;3.2 E:IAS;39 9.2.1;3.2.1 Systemaufbau;39 9.2.2;3.2.2 Konfiguration;41 9.2.3;3.2.3 Such- und Indexierungsablauf;41 9.2.4;3.2.4 Verbesserungspotentiale;48 10;4 Thesaurusbasierte Suche;50 10.1;4.1 Ist-Stand;50 10.2;4.2 Realisierte Systemerweiterungen;50 10.2.1;4.2.1 Ähnlichkeitsmaße in e:IAS;50 10.2.2;4.2.2 Mögliche Thesauri und Datenquellen;57 10.2.3;4.2.3 Beispielhafte Einbindung von Thesauri;62 10.2.4;4.2.4 Gewichtung von Attributen und Synonymen;66 10.3;4.3 Analyse der Suchergebnisse;71 11;5 Barrierefreie Präsentation der Suchergebnisse;74 11.1;5.1 Ist-Stand;74 11.2;5.2 Realisierte Systemerweiterung;75 11.2.1;5.2.1 Zugriff auf die Ergebnisdaten;75 11.2.2;5.2.2 Aufbau der GUI;76 11.2.3;5.2.3 Verwandte Links;83 12;6 Logdateiauswertung;88 12.1;6.1 Ist-Stand;88 12.1.1;6.1.1 Analyse des Benutzerverhaltens;88 12.1.2;6.1.2 Anforderungen an die Logdateiauswertung;92 12.2;6.2 Realisierte Systemerweiterung;92 12.2.1;6.2.1 Erzeugung der Logdateien in e:IAS;92 12.2.2;6.2.2 Datenschutz;96 12.2.3;6.2.3 Umwandlung der Logdatei mit Shell-Skripten;96 12.2.4;6.2.4 Prototyp einer Logdateianalyse in Perl;97 12.2.5;6.2.5 Stresstest;106 13;7 Ausblick;107 14;Literaturverzeichnis;109 15;Anhang;113 15.1;Anhang 1 BIENE Kriterien;114 15.2;Anhang 2 - Themen des GEMET-Thesaurus;134 15.3;Anhang 3 - Themen
des eurovoc-Thesaurus;135 15.4;Anhang 4 - Dateien des eurovoc-Thesaurus;136 15.5;Anhang 5 XSL-Stylsheets zur Umwandlung des eurovoc-Thesaurus;139 15.6;Anhang 6 - SPARQL-Abfragen für GEMET;143 15.7;Anhang 7 - Vergleich der Suchergebnisse;145 15.8;Anhang 8 - Auswertung der ersten 101 BIENE-Kriterien;146 15.9;Anhang 9 Screenshots der ausgewerteten Seiten;148 15.10;Anhang 10 Mögliche e:Script Tags;150 15.11;Anhang 11 - Eingesetzte e:Script Tags;157 15.12;Anhang 12 - Barrierefreie Navigation;159 15.13;Anhang 13 - JavaScript Navigation;167 15.14;Anhang 14 Shell-Skript zur Logdatei-Umwandlung;170 15.15;Anhang 15 Dokumentation der Logdatei-Auswertung;172 15.16;Anhang 16 HowTo-Dokument: Domain hinzufügen;184 15.17;Anhang 17 Top-Kategorien der HUGO-Navigation;191 15.18;Anhang CD Zusätzliche Daten in digitaler Form;192