Előítéletes intelligenciák korát éljük

2023. ápr. 18.

Fehér emberként egyszerűen feltételezhető, hogy a virtuális asszisztensek, mint Siri, Alexa, az Assistant vagy akár a telefon kamerája – zökkenőmentesen működik a dobozból kivéve. Azért feltételezhető, mert azok a szakemberek, akik ezeket az eszközöket tervezik és programozzák, túlnyomó többségükben úgy néznek ki és úgy is beszélnek, mint a többi fehér ember. Azok az emberek, akiknek több melanin van a bőrükben, vagy ízesebben beszélnek, azok nem élvezik ugyanezt a kiváltságot – világít rá a különbségekre cikkében az Engadget.

A jövőben a chatbotok és a vizuális mesterséges intelligenciák csak tovább fokozzák majd ezt az előítéletességet, hacsak nem teszünk lépéseket annak érdekében, hogy ezek a rendszerek méltányos és megértő viselkedést tanúsítsanak. E probléma megoldására a Meta AI-kutatói kifejlesztették és 2021-ben kiadták a Casual Conversations adathalmazt, amelynek célja, hogy „segítsen a kutatóknak értékelni a számítógépes látás- és hangmodellek pontosságát a kor, a nemek, a látható bőrtónusok, valamint a környezeti fényviszonyok sokfélesége mellett.” Csütörtökön a vállalat bemutatta a Casual Conversations v2-t, amely még finomabb osztályozási kategóriákat ígér, mint elődje.

Az eredeti CC-adatkészlet 45000 videót tartalmazott több mint 3000 alanyról, kor, nem, bőrszín és fényviszonyok szerint. Ezeket a videókat úgy tervezték, hogy hozzáférhető és felhasználható legyen más AI-kutatók számára is. Ez az adatkészlet teszi lehetővé a méltányos, előítéletmentes működést, nézzen ki a felhasználó akár úgy, mint Anya Taylor Joy vagy Lupita Nyong’o, vagy beszéljen úgy, mint Colin Firth vagy Colin Quinn.

A keddi bejelentés szerint a két évvel ezelőtti Casual Conversations debütálása óta a Meta – „belső szakértőkkel konzultálva, például a polgári jogok területén” – dolgozik az adatállomány bővítésén és javításán. Pascale Fung professzor, a Centre for AI Research igazgatója, valamint a Hongkongi Tudományos és Technológiai Egyetem más kutatói is részt vettek a kormányzati és ipari adatok irodalmi áttekintésében, hogy megállapítsák az új megjegyzési kategóriákat.

A második verzió már 11 kategóriát és 26467 videómonológot tartalmaz, amelyeket hét országban – Brazíliában, Indiában, Indonéziában, Mexikóban, Vietnámban, a Fülöp-szigeteken és az Egyesült Államokban közel 5600 alany rögzített. Bár az új adathalmazban nincs annyi egyéni videó, mint a korábbiakban, viszont sokkal több kommentárral látták el azokat.

- Hirdetés -

„Az egyenlő bánásmód, a méltányosság és a biztonság növelése érdekében az AI-ban fontos, hogy az adatkategóriákon belül inkluzív információkkal és sokszínűséggel rendelkezzünk, így a kutatók jobban fel tudják mérni, hogy az adott modell vagy AI-alapú termék mennyire működik jól a különböző összetételű demográfiai csoportok esetében” – mondta a közleményben Roy Austin, a Meta alelnöke. „Ez az adatkészlet fontos szerepet játszik annak biztosításában, hogy a technológiánk méltányosan működjön minden felhasználónk számára.”

Ahogy a vállalat csütörtökön utalt arra, hogy mint a legtöbb nyilvános AI-kutatását, a Meta a Casual Conversations v2-t nyílt forráskódú adatkészletként adja ki, amelyet bárki használhat és bővíthet – például olyan attribútumokkal rendelkező személyek, akik fogyatékkal élők, akcentussal vagy más dialektussal beszélnek.”

Némethi Botond, NEW technology magazin

- Hirdetés -