Bis zu 50 % günstiger als neu
3 Jahre rebuy Garantie
Professionelles Refurbishment
ElektronikMedien
Tipps & News
AppleAlle anzeigen
TabletsAlle anzeigen
HandyAlle anzeigen
Fairphone
AppleAlle anzeigen
iPhone Air Generation
GoogleAlle anzeigen
Pixel Fold
HonorAlle anzeigen
HuaweiAlle anzeigen
Honor Serie
NothingAlle anzeigen
OnePlusAlle anzeigen
OnePlus 11 GenerationOnePlus 12 Generation
SamsungAlle anzeigen
Galaxy XcoverWeitere Modelle
SonyAlle anzeigen
Weitere Modelle
XiaomiAlle anzeigen
Weitere Modelle
Tablets & eBook ReaderAlle anzeigen
Google
AppleAlle anzeigen
HuaweiAlle anzeigen
MatePad Pro Serie
MicrosoftAlle anzeigen
XiaomiAlle anzeigen
Kameras & ZubehörAlle anzeigen
ObjektiveAlle anzeigen
Samyang
System & SpiegelreflexAlle anzeigen
CanonAlle anzeigen
FujifilmAlle anzeigen
OlympusAlle anzeigen
PanasonicAlle anzeigen
SonyAlle anzeigen
WearablesAlle anzeigen
Fitness TrackerAlle anzeigen
SmartwatchesAlle anzeigen
Xiaomi
Konsolen & ZubehörAlle anzeigen
Lenovo Legion GoMSI Claw
NintendoAlle anzeigen
Nintendo Switch Lite
PlayStationAlle anzeigen
XboxAlle anzeigen
Audio & HiFiAlle anzeigen
KopfhörerAlle anzeigen
FairphoneGoogle
LautsprecherAlle anzeigen
GoogleYamahatonies
iPodAlle anzeigen

Handgeprüfte Gebrauchtware

Bis zu 50 % günstiger als neu

Der Umwelt zuliebe

Teilautomatisierte Verschlagwortung von in altdeutschen Schriftfonts gesetzten Texten mit Hilfe lernender Verfahren

Lothar Mischke (Broschiert, Deutsch)

Keine Bewertungen vorhanden
Optischer Zustand
Beschreibung
Die Dissertation von Lothar Mischke lässt sich in aktuelle Forschungsbestrebungen zur Wahrung des kulturellen Erbes, insbesondere durch den Aufbau historischer Teilkorpora zu Literatur einer bestimmten Epoche, ausgewählter Autoren oder eines Genres einordnen. Alle diese Bestrebungen haben mit der Tatsache zu kämpfen, dass Texte deutscher Sprache vor 1930 im Allgemeinen in altdeutschen Schriftfonts gesetzt sind, die in sich stark differieren. Dadurch entziehen sie sich einer automatischen Digitalisierung mit den gängigen OCR-Programmen. Da zudem vor der Rechtschreibreform 1901 vielfältige historische Schreibungen auftreten, die sich von modernen Schreibungen deutlich unterscheiden, war man bisher darauf angewiesen, zur Unterstützung spezieller OCR-Software in der Erkennungsphase wie auch in Suchanfragen für jede Sprachregion und Epoche spezielle Wörterbücher und Grammatikmodelle bereitzustellen, was mit hohem Aufwand verbunden ist. So steht am Ausgangspunkt dieser Arbeit die Fragestellung, ob unter Verzicht auf eine Volltexterkennung eine automatisierte Schlagworterkennung in diesen Korpora ohne Nutzung von Spezialwörterbüchern fehlertolerant gegenüber historischen oder OCR-bedingten Schreibvarianten möglich ist. Hier betritt die Arbeit Neuland im Umfeld der Weiterentwicklung und des Einsatzes von intelligenten Algorithmen der Bildverarbeitung und Mustererkennung und Klassifizierung. Sie entwickelt eine umfassende Methodik zur Schlagworterkennung, -lokalisierung und -annotation und trägt dabei neue wissenschaftliche Erkenntnisse zu den folgenden Punkten bei: * Dokumentrestaurierung: Es werden typische Bildstörungen wie Schattenbildung, Schieflage und Dokumentverzerrungen modellunabhängig über die Kombination bekannter und die Entwicklung neuer Verfahren korrigiert * Vorklassifikation: Anhand neuer robuster Merkmale und eines entscheidungsbaumbasierten Verfahrens findet eine Zeichenvorklassifizierung statt * Erkennung: Entwicklung einer lernfähigen zeichen-, kontext- und ganzwortbasierten Teiltexterkennung unter Extrahierung hierarchisch organisierter Layoutinformation * Systemerstellung: Organisation der Arbeitsschritte der Digitalisierung, Segmentierung, Layoutanalyse, Bildrestaurierung, Textteilerkennung und Schlagwortlokalisation automatisiert oder schrittweise benutzergesteuert. Dazu wird ausgehend von Beiträgen der aktuellen wissenschaftlichen Diskussion ein Erkenner für Zeichen altdeutscher Fonts entwickelt, der mit Hilfe von Gruppen Neuronaler Netze bzw. Support-Vektor-Maschinen eine Klassifizierung mit überwachten Verfahren vornimmt. Darüber hinaus entwirft der Autor ein kontextbasiertes Omnifont-Erkennungssystem beruhend auf unüberwachter Clusteranalyse und implementiert es auch. Die Erkennungsparameter Precision und Recall liegen hier im Schnitt bei 97.5 % bzw. 92.5 %. Schließlich wird bei der Schlagwortsuche ein optimistisches Kombinationsverfahren vorgestellt, mit dessen Hilfe eine Rangordnung auf Basis eines gewichteten Mehrheitsvotums der beteiligten Erkenner entsteht, bei der in mehr als 90 % aller Fälle der beste Treffer bereits das gesuchte Schlagwort darstellt.
Dieses Produkt haben wir gerade leider nicht auf Lager.
ab 33,99 €
Derzeit nicht verfügbar
Derzeit nicht verfügbar

Handgeprüfte Gebrauchtware

Bis zu 50 % günstiger als neu

Der Umwelt zuliebe

Technische Daten


Erscheinungsdatum
01.07.2007
Sprache
Deutsch
EAN
9783832516314
Herausgeber
Logos Berlin
Serien- oder Bandtitel
Studien zur Mustererkennung
Sonderedition
Nein
Autor
Lothar Mischke
Seitenanzahl
302
Einbandart
Broschiert
Bandzählung
24
Schlagwörter
Schlagworterkennung, Historische Schriften, Dokumentrestaurierung, Dokumentanalyse, Mustererkennung
Höhe
210 mm
Breite
14.5 cm

Warnhinweise und Sicherheitsinformationen

Informationen nach EU Data Act

-.-
Leider noch keine Bewertungen
Leider noch keine Bewertungen
Schreib die erste Bewertung für dieses Produkt!
Wenn du eine Bewertung für dieses Produkt schreibst, hilfst du allen Kund:innen, die noch überlegen, ob sie das Produkt kaufen wollen. Vielen Dank, dass du mitmachst!