Daten und KI
Die Thematik von Datenqualität (und -quantität) ist zu Beginn ein Hauptthema in unseren Projekten. Durch den Fokus auf den fachlichen Schwerpunkt Rezepturen ist oft sogar nur die Frage nach der Menge dominant, denn die Qualität der Daten ist im Entwicklungsumfeld tendenziell gut.
Ausgangspunkt für jedes KI-Projekt ist die Auswahl der passenden KI-Modellierungsstrategie. Dazu muss die Aufgabenstellung möglichst exakt definiert werden. Wir fokussieren uns dabei in den ersten Schritten auf wenige Zielsetzungen, die wir im QuickScan prinzipiell und dann im Proof-of-concept konkret validieren und umsetzten. Durch unsere Erfahrungen in diesem Umfeld, müssen wir nicht mit Evaluierungen (herum)probieren, sondern gehen die gesuchten Fragestellungen gezielt an.
Die Auswahl der Daten aus Mess-, Rezeptur- oder Laborwerten erfolgt zügig und zielgerichtet. Dabei haben wir bereits mit 40, wie mit über 10.000 Datensätzen, gute bis sehr gute Ergebnisse erzielt. Eine Zielsetzung im Lackbereich war perspektivisch ein DeltaE im gesamten Farbraum unter 1,5 zu erreichen.
Der Mythos „Viel hilft viel“ ist im KI-Umfeld weit verbreitet. Um eine KI richtig zu trainieren, zählt neben der Quantität aber insbesondere die Qualität der Trainings- und Testdaten. Hier verwenden wir im Vorgehen Qualitätssicherungen, um Widersprüche in den Daten aufzuspüren. Zusätzlich werden Themen wie Over- und Underfitting adressiert und wir Testen bewusst die Grenzen unser Modelle aus.
Zusammenfasst reduzieren wir die Komplexität durch unser Domänenwissen bereits entscheidend, kennen geeignete KI-Modellierungen gehen so das Thema von Daten zur KI-Umsetzung sehr fokussiert an.