Blogg

1.7.2022 12.26

Dålig data är ett hot mot framgångsrik AI

  • Datahantering och kvalitet
  • Dataplattformar & rapportering
  • Kunddata och CRM

Diskussionen om artificiell intelligens, AI, handlar ofta idag om teknologi och algoritmer. Det är förståeligt eftersom skapandet av algoritmer som stöd för beslutsfattandet inte bara är nytt utan också mycket krävande.

Dock leder det ofta till missuppfattningen att ett misslyckat AI-projekt skulle bero på underutvecklade algoritmer som inte kan möta behoven hos ett företag eller en bransch, medan det i verkligheten många gånger handlar om att den data som används inte är tillräckligt bra eller felvalda för ändamålet. 

Kvaliteten på en slutsats som dragits av AI är beroende av kvaliteten på den data som AI givits. Till skillnad från människor förstår inte AI vad som är en felaktig slutsats som dragits på grund av felaktiga data såvida man inte uttryckligen lär AI detta.

Om AI ser en bild av någon som äter en apelsinisglass så förstår den inte att det existerar ett oändligt antal situationer då det är en dålig idé att äta gul snö. Det finns helt enkelt inte bilder eller data gällande dem. På det här sättet lär sig AI att anse att gul snö är isglass.

 

Det största hotet mot ett framgångsrikt AI-projekt är data som misstagits för att vara bra

AI lär sig utifrån data. När man lär AI att ta beslut baserade på dåliga data så tar AI systematiskt dåliga beslut. Det största hotet mot ett framgångsrikt AI-projekt är data människor har trott varit bra. AI-applikationer kan visserligen även användas för att korrigera data, men att använda en AI för att korrigera data och sedan en annan AI för att dra slutsatser utifrån korrigerade data ökar riskerna.

Kvalitetskraven på data beror också mycket på risknivån hos de beslut som tas av AI. Om man har råd att ta risker kan också sämre data duga.

Bakom framgångsrika AI-projekt ligger sällan den mest finslipade algoritmen, utan istället handlar det om att man har lärt AI på ett genomtänkt och kontinuerligt sätt. När man lär AI behöver man använda data som är väsentliga för inlärningen och fundera noga på hur inlärningen ska kunna mätas. Väsentliga data betyder tre saker: lämpar sig data för syftet i fråga, kan data användas i kontexten och är datakvaliteten tillräckligt god?

 

Om AI matas med dålig data blir den allt annat än intelligent

Kvaliteten på den data som används vid inlärningen är den avgörande faktorn för ett framgångsrikt AI-projekt. Fel och snedvridningar i data påverkar hur AI beter sig. Syftet fastställer målet med inlärningen. Med andra ord, lär sig AI att dra rätt slutsatser av givna data? Lämpligheten för kontexten fastställs oftast utifrån företagets riktlinjer, avtal kring användandet av nämnda data eller av lagar. Att uppnå en god datakvalitet är enkelt. Samtidigt är det ofta det största hindret för att AI-projekten ska nå framgång.

Hur kommer det sig då att data inte är av hög kvalitet? Lustigt nog så vet inte ens ledningen i de flesta organisationer att deras data inte är i ordning. Att underhålla data är egentligen inte ett så svårt problem att det borde kräva ledningens uppmärksamhet. Det kräver emellertid resurser och särskilt före AI hade datakvalitet låg prioritet så annat som ledningen anser viktigare kör förbi både till höger och vänster.

Det är möjligt att få ordning på sina data då dessa har förståtts, beskrivits och ansvaret för dessa har organiserats. Läget får inte förändras fast en person lämnar organisationen. Att underhålla data är inte svårt i sig men det kräver resurser och belastar ofta personer som redan har mycket att göra, vilket har lett till att det inte blivit gjort.

Om företagets data inte är i ordning så är det egentligen onödigt att ens drömma om framgångsrika digitaliseringsprojekt. Först när företagets data är i ordning kan man börja fundera på det som är temat i vår nästa blogg, nämligen att identifiera fördelarna med AI. Om AI matas med dålig data blir den allt annat än intelligent.

Den här artikeln är en del av vår bloggserie. Läs de andra delarna av serien.

AIGA, (Artificial Intelligence Governance and Auditing)

Den här bloggen anknyter till AIGA-projektet (Artificial Intelligence Governance and Auditing). Syftet med projektet AIGA är att öka finländska företags internationella konkurrenskraft och kompetens genom att på ett pålitligt och kontrollerat sätt skala AI och dra nytta av AI i hela organisationen.

I AIGA-projektet bedrivs, i forsknings- och företagssamarbete, forskning och utveckling kring modeller och mekanismer för att hantera AI, inklusive kommersialisering och introduktion av dessa på den internationella marknaden. Huvudfinansiär för det tvååriga projektet är Business Finland.



Se min profil


Tero Laatikainen

Tero Laatikainen är Loihde Advisory Oy:s direktör för utveckling av serviceområden. Han är också en van MDM-konsult och MDM-utbildare.

Se min profil

Följ vår blogg