No English version available
DNA Profiler
Der Firma MC-T (Methods, Contents and Tools) GmbH ist es mit einem neuartigen Verfahren gelungen, Stellenausschreibungen und CV's (Curriculae vitae) äussert effizient miteinander zu vergleichen und einander zuzuordnen. Dieses Verfahren soll nun zu einem selbstlernenen System weiterentwickelt werden, welches sich selbst in einem fortlaufenden Prozess optimieren kann.
Ausgangslage
Der Firma MC-T (Methods, Contents and Tools) GmbH ist es mit einem neuartigen Verfahren gelungen, Stellenausschreibungen und CV's (Curriculae vitae) äussert effizient miteinander zu vergleichen und einander zuzuordnen. Dazu werden Textdateien (z.B. Word, ASCII, RTF oder andere elektronisch lesbare Dateien) durch die von MC-T entwickelte Technologie analysiert, bewertet und verglichen, ohne das diese manuell in ein vorgegebenes Raster eingefügt werden müssen.
Das Verfahren arbeitet in drei Schritten:
- Die DNA-Sprachanalyse simuliert den menschlichen Lesevorgang und interpretiert den Text. Dabei wird das Dokument nach verschiedenen Kriterien bewertet. Diese Bewertungen bilden das DNA-Profil des Dokuments.
- Diese DNA-Profile werden nun in einer Fuzzy-Logic verglichen. Dem Nutzer kann so eine nach dem Übereinstimmungsgrad sortierte Liste präsentiert werden.
- Der Nutzer kann nun durch diese Vorauswahlliste direkt auf die besten Einträge zugreifen. Die definive Auswahl bleibt weiterhin in der Hand des Benutzers.
Projektziele
In diesem KTI-Projekt soll das von MC-T entwickelte Verfahren zu einem selbstlernenden System erweitert werden. Aufgrund der tatsächlichen Auswahl, welcher der Benutzer in der erzeugten Vorauswahlliste trifft, lassen sich Rückschlüsse auf die Qualität der Vorauswahlliste ziehen. Diese Informationen sollen verwendet werden, um das Abgleichverfahren kontinuierlich zu verbessern.
In einer ersten Phase wird das dynamische Matching optimiert. Dazu wird der bestehende Algorithmus analysiert und überarbeitet. Anschliessend wird die Parameteroptimierung für das dynamische Matching automatisiert. Die Optimierung soll für den Benutzer in Sekundenschnelle erfolgen; mit der gegenwärtigen Technik sind allerdings Rechenzeiten von circa 20 Minuten notwendig. D.h. es müssen Methoden entwickelt werden, um für die optimalen Parameter in wesentlich kürzerer Zeit (rund 1000 mal schneller) gute Näherungen zu finden.
In der zweiten Phase soll die Sprachanalyse optimiert werden. Auch hier dienen die effektiven Selektionen der Benutzer als Grundlage für die Optimierung. Eine Optimierung der Fuzzy-Logic Parameter für die viel komplexere Sprachanalyse würde mit der gegenwärtigen Technik Rechenzeiten von circa 30 Jahren benötigen; sinnvollerweise muss aber eine solche globale Optimierung in einem "Übernachtprozess" möglich sein. Dies bedeutet wiederum, dass Methoden entwickelt werden müssen, welche die optimalen Parameter in wesentlich kürzerer Zeit (rund 30'000 mal schneller) gut annähern.
Mehr Informationen
http://www.mc-t.ch/
Projektbeteiligte
Leitung
- Prof. Dr. Manfred Vogel
Projektteam
- Stefan Müller
- Lukas Kellenberger
Partner
- MC-T (Methods, Contents and Tools) GmbH

