Onderzoekers hebben een skills-gebaseerd AI-framework ontwikkeld voor embedded systemen, met 99% succes op echte hardware.

Onderzoekers hebben een doorbraak gerealiseerd in het gebruik van AI-agents voor de ontwikkeling van embedded en Internet-of-Things (IoT) systemen. Met een nieuw skills-gebaseerd framework bereiken AI-agents nu bijna perfecte prestaties bij het programmeren van echte hardware.
Hoewel grote taalmodellen (LLM's) en AI-agents veelbelovend zijn gebleken voor geautomatiseerde softwareontwikkeling, bleef hun toepassing op embedded systemen problematisch. De nauwe koppeling tussen softwarelogica en fysiek hardwaregedrag zorgt ervoor dat code die succesvol compileert, nog steeds kan falen op echte apparaten.
De problemen ontstaan door:
Om deze uitdagingen aan te pakken, hebben de onderzoekers IoT-SkillsBench geïntroduceerd - een uitgebreide benchmark die AI-agents systematisch evalueert in echte embedded programmeeromgevingen.
De benchmark omvat:
Elke taak wordt getest onder drie verschillende agent-configuraties:
De resultaten zijn indrukwekkend. Uit 378 hardware-gevalideerde experimenten blijkt dat beknopte, door menselijke experts ontworpen vaardigheden met gestructureerde expertkennis bijna perfecte succespercentages mogelijk maken op alle platforms.
Dit betekent een revolutie voor de embedded ontwikkeling, waar traditioneel veel handmatige expertise en trial-and-error testing nodig was.
Deze doorbraak heeft verstrekkende gevolgen voor de IoT- en embedded systeenindustrie:
Versnelde ontwikkeling: AI-agents kunnen nu betrouwbaar embedded code genereren die daadwerkelijk werkt op echte hardware, wat de ontwikkeltijd drastisch verkort.
Democratisatie van expertise: Ontwikkelaars zonder diepgaande hardware-ervaring kunnen nu complexe embedded systemen bouwen dankzij AI-assistentie.
Kwaliteitsverbetering: Door de systematische validatie op echte hardware worden fouten vroegtijdig ontdekt en opgelost.
Het onderzoek toont aan dat de combinatie van AI-agents met zorgvuldig ontworpen, gestructureerde expertkennis de sleutel is tot succes in embedded ontwikkeling. Dit opent nieuwe mogelijkheden voor automatisering in een sector die traditioneel sterk afhankelijk was van menselijke expertise.
Met IoT-SkillsBench hebben onderzoekers en ontwikkelaars nu ook een robuuste manier om AI-agents te evalueren en verbeteren voor embedded toepassingen, wat verdere vooruitgang in dit gebied zal stimuleren.

Onderzoekers ontwikkelen S3T-Former, een energiezuinige spiking neural network voor skelet-gebaseerde actieherkenning die de problemen van traditionele AI-modellen oplost.

ClawWorm is de eerste zelfkopiërende malware voor AI-agenten, met een infectiekans van 64,5% via één enkel bericht.

Onderzoekers ontwikkelen geavanceerd AI-systeem dat externe visuele tools gebruikt om gezichtsvervalsingsbeter te detecteren via stap-voor-stap redenering.