Onderzoekers hebben een skills-gebaseerd AI-framework ontwikkeld voor embedded systemen, met 99% succes op echte hardware.

Onderzoekers hebben een doorbraak gerealiseerd in het gebruik van AI-agents voor de ontwikkeling van embedded en Internet-of-Things (IoT) systemen. Met een nieuw skills-gebaseerd framework bereiken AI-agents nu bijna perfecte prestaties bij het programmeren van echte hardware.
Hoewel grote taalmodellen (LLM's) en AI-agents veelbelovend zijn gebleken voor geautomatiseerde softwareontwikkeling, bleef hun toepassing op embedded systemen problematisch. De nauwe koppeling tussen softwarelogica en fysiek hardwaregedrag zorgt ervoor dat code die succesvol compileert, nog steeds kan falen op echte apparaten.
De problemen ontstaan door:
Om deze uitdagingen aan te pakken, hebben de onderzoekers IoT-SkillsBench geïntroduceerd - een uitgebreide benchmark die AI-agents systematisch evalueert in echte embedded programmeeromgevingen.
De benchmark omvat:
Elke taak wordt getest onder drie verschillende agent-configuraties:
De resultaten zijn indrukwekkend. Uit 378 hardware-gevalideerde experimenten blijkt dat beknopte, door menselijke experts ontworpen vaardigheden met gestructureerde expertkennis bijna perfecte succespercentages mogelijk maken op alle platforms.
Dit betekent een revolutie voor de embedded ontwikkeling, waar traditioneel veel handmatige expertise en trial-and-error testing nodig was.
Deze doorbraak heeft verstrekkende gevolgen voor de IoT- en embedded systeenindustrie:
Versnelde ontwikkeling: AI-agents kunnen nu betrouwbaar embedded code genereren die daadwerkelijk werkt op echte hardware, wat de ontwikkeltijd drastisch verkort.
Democratisatie van expertise: Ontwikkelaars zonder diepgaande hardware-ervaring kunnen nu complexe embedded systemen bouwen dankzij AI-assistentie.
Kwaliteitsverbetering: Door de systematische validatie op echte hardware worden fouten vroegtijdig ontdekt en opgelost.
Het onderzoek toont aan dat de combinatie van AI-agents met zorgvuldig ontworpen, gestructureerde expertkennis de sleutel is tot succes in embedded ontwikkeling. Dit opent nieuwe mogelijkheden voor automatisering in een sector die traditioneel sterk afhankelijk was van menselijke expertise.
Met IoT-SkillsBench hebben onderzoekers en ontwikkelaars nu ook een robuuste manier om AI-agents te evalueren en verbeteren voor embedded toepassingen, wat verdere vooruitgang in dit gebied zal stimuleren.

Nieuw AI-systeem voorspelt minimaal benodigde beeldresolutie voor visuele taalmodellen, wat tot 80% minder rekenkracht kan opleveren.

Nieuwe techniek gebruikt superklassen om AI-modellen robuuster te maken tegen misleidende patronen zonder handmatige labels.

Nieuw onderzoek toont aan dat de structuur van woordenschat crucialer is dan vrije woordvolgorde voor hoe AI-modellen talen leren.