Neurosoft

Neurosoft Sp. z o.o. wurde im Jahr 1992 in Wroclaw gegründet. Wir sind eine spinn off Firma der Technischen Universität Wroclaw und der Universität Wroclaw. Dank der engen Zusammenarbeit mit den beiden Hochschulen entwickeln wir und forschen wir nach neuen Technologien und Lösungen im Bereich der künstlichen Intelligenz. Neben der Forschung bietet Neurosoft seit Februar 2000 auch ein breites Spektrum an Digitalisierungs-Dienstleistungen an. Alle unsere Produkte und Lösungen verwenden vor allem die von uns entwickelten Technologien. Entsprechend dem Motto von Kurt Lewin : „Es gibt nichts Praktischeres als eine gute Theorie“, geben wir der Grundlagenforschung einen sehr hohen Stellenwert.

Neurosoft ist Mitglied im ELSNET (European Network of Excellence in Human Language Technology) und seit 2007 das assoziierte Mitglied im AKEP (Arbeitskreis des Elektronischen Publizierens) des Börsenverein des Deutschen Buchhandels.

Technologie
Wir suchen nach neuen Verfahren und Algorithmen für Bildverarbeitung, Sprach-verarbeitung und Verarbeitung der natürlichen Sprache (NLP). Dabei stützen wir uns in allen Bereichen auf die neuronalen Netze die für unterschiedliche Erkennungs- und Klassifizierungsaufgaben projekt- und bereichübergreifend eingesetzt werden.

Bild- und Dokumentenverarbeitung
Im Bereich der Bildverarbeitung haben wir eine Reihe von Werkzeugen und Produkten erstellt die das Arbeiten mit Dokumenten benutzerfreundlicher und wesentlich einfacher machen. Unser Framework ermöglicht eine automatische oder beinahe automatische Konvertierung der herkömmlichen Papierdokumente (Bücher, Zeitungen und anderer Publikationen) in ihre elektronischen Fassungen. Das Framework basiert auf unserer eigenen Technologie der optischen Zeichenerkennung, die in Verbindung mit linguistischen Verfahren eine hervorragende Erkennungsqualität hervorbringt. Die generierten, elektronischen Dokumente haben, neben der Seitenabbildungen, eine integrierte Textschicht für die Volltexstsuche und die synthetische Sprachausgabe (DAISY-Standard). Durch den integrierten Einsatz unserer DRM-Technologie (digital rights mnagement) werden Autoren- und Verlagsrechte gegen unberechtigte Eingriffe wirksam geschützt. Unsere Lösung wurde speziell für Distribution der elektronischer Dokumente via Internet entwickelt.

Sprachverarbeitung
Seit ihrer Gründung betreibt Neurosoft Forschung im Bereich der Sprachverarbeitung. Im Jahr 1995 haben wir das erste Programm zu Sprachausgabe in Polnisch vorgestellt „SynTalk“, das zum Klassiker geworden ist. Zur Zeit arbeiten wir an einer neuen Version des Programms, dem Nachfolger - SynTalk 2.0. Die Markteinführung ist fürs Ende 2007 geplant. Die im Rahmen dieses Projektes entwickelte Technologie nutzen wir auch für die Spracherkennung. Diese Technologie wird bei einem neuen Projekt, das in Zusammenarbeit mit dem Polnischen Nationalen Fernsehen (TVP) entsteht, für die automatische Indexierung aller digitalisierten Sendungen eingesetzt.

Verarbeitung der natürlichen Sprache (NLP)
Neurosoft entwickelt linguistische Werkzeuge die eine einfachere Mensch-Maschinen-Kommunikation ermöglichen sollen. Die entwickelten Verfahren finden eine breite Anwendung in der Spracherkennung und Sprachausgabe, Texterkennung, Text mining und Texteinreicherung oder Wissensextrahierung. Das wichtigste Anwendungsgebiet ist aber die Volltextsuche. Hier haben wir eine Lösung mit dem Name „NeuroScope“ entwickelt, die eine andere Art der Suche verwirklicht. Im Gegensatz zu den auf dem Markt verfügbaren Suchmaschienen setzten wir in erster Linie nicht statistischen sondern linguistische Verfahren für die semantische Suche ein.

Digitalisierung
Nachfolgend wurden einige Digitalisierungsprojekte, die wir bereits realisiert haben, beschrieben.

NeuroLex – System zur Verarbeitung der juristischen Dokumente
NeuroLex wurde für den Verlag C.H. Beck Polska erstellt und wird zur Verarbeitung der juristischen Dokumente verwendet. Im Rahmen des Projektes wurde ein Workflow entwickelt, das ein komplette Verarbeitung vom Papierdokument bis zum strukturierten Text in XML-Format ermöglicht. Die Dokumente werden digitalisiert (gescannt; das Bild entsprechen verarbeitet), die darin enthaltenen Texten mit OCR erkannt und anschließend im XML Format strukturalisiert. Dabei wird eine Reihe von unterschiedlichen sowohl passiven als auch aktiven Verweisen generiert. Die auf diese Weise erstellten Daten verwendet der Verlag für gedruckte sowie elektronischen Publikationen (Legalis). Neurosoft beliefert den Verlag seit über sechs Jahren mit aktuellen und strukturierten Daten. Im Rahmen dieses Projektes wurden bislang über 200.000 Dokumente mit insgesamt 850000 Seiten verarbeitet.

NeuroNorm
NeuroNorm ist ein Workflow zur Aggregation, Verarbeitung und Distribution der Dokumente die Normen beinhalten. Ergänzend zu der Funktionalität, die NeuroLex besitzt, haben wir bei NeuroNorm auch das Publizieren auf CD integriert. Den wichtigsten Teil des Systems stellt das Internetportal eNormy.pl (www.eNormy.pl ) dar, in dem Benutzer die Normen kaufen können. Jedes Dokument, das durch eNormy.pl gekauft wird, ist mit dem DRM Verfahren gesichert. Der Service bietet einzigartige Lösungen im Bereich des virtuellen Lesens an. Es wird nicht nur der Kauf des Dokumentes ermöglicht, sondern auch einfach ein Ausleihen. Bei entsprechender Bezahlung bekommt der Benutzer einen zeitlich begrenzten Zugang zum Dokument (wie in einer gewöhnlichen Bibliothek). Am Ende der Ausleihzeit muss sich der Kunde keine Sorgen um eine rechtzeitige Abgabe machen; das Dokument löscht sich ganz automatisch. Im Rahmen dieses Projektes wurden fast 30 000 Dokumente und fast 500 000 Seiten verarbeitet.