Hackers zijn vastbesloten om AI te verbeteren

Inhoudsopgave:

Hackers zijn vastbesloten om AI te verbeteren
Hackers zijn vastbesloten om AI te verbeteren
Anonim

Belangrijkste afhaalrestaurants

  • Een nieuw collectief van ontwikkelaars bouwt open-source AI-modellen.
  • De groep gebruikt enorme ta altrainingsmodellen die het onder open licenties zal vrijgeven.
  • Open-source AI zou kunnen helpen om de potentieel baanbrekende kracht van de nieuwe technologie minder vatbaar te maken voor vooroordelen en fouten.
Image
Image

Er wordt veel onderzoek gedaan naar kunstmatige intelligentie door grote bedrijven (AI), maar één online groep wil het proces democratiseren.

EleutherAI is een recent gevormd collectief van vrijwillige onderzoekers, ingenieurs en ontwikkelaars die zich richten op open-source AI-onderzoek. De organisatie gebruikt de GPT-Neo- en GPT-NeoX-codebases om enorme taalmodellen te trainen die ze van plan is vrij te geven onder open licenties.

"Open source data komt ten goede aan onderzoekers omdat wetenschappers meer vrije middelen hebben om modellen te trainen en onderzoek te voltooien", vertelde Edward Cui, de CEO van AI-bedrijf Graviti, aan Lifewire in een e-mailinterview. Zijn bedrijf is niet betrokken bij EueutherAI. "We weten dat tientallen AI-projecten werden opgehouden door een algemeen gebrek aan hoogwaardige gegevens uit echte gebruiksgevallen, dus het is van vitaal belang om met de hulp van de deelnemende gemeenschap richtlijnen op te stellen die de gegevenskwaliteit garanderen."

Dit is de manier

Het begin van de EleutherAI was bescheiden. Vorig jaar plaatste een onafhankelijke AI-onderzoeker, Connor Leahy genaamd, het volgende bericht op een Discord-server: "Hé jongens, laten [SIC] OpenAI een run voor hun geld geven zoals in de goede oude tijd."

En zo werd de groep gevormd. Het heeft nu honderden bijdragers die hun code op de online softwarerepository GitHub plaatsen.

Open-sourcing AI-inspanningen zijn niet nieuw. Het Airflow-workflowbeheerplatform van Airbnb en de data-ontdekkingsengine van Lyft zijn het resultaat van het gebruik van open source-tools om datateams in staat te stellen beter met data te werken, aldus Ali Rehman, projectmanager voor softwarebedrijf CloudiTwins in een e-mailinterview met Lifewire..

"Net zoals de open-sourcerevolutie heeft geleid tot een transformatie van softwareontwikkeling, heeft het ook geleid tot de ontwikkeling en democratisering van datawetenschap en kunstmatige intelligentie", zei Rehman. "Open source is een cruciale factor geworden voor enterprise data science-oplossingen, waarbij de meeste datawetenschappers open source-tools gebruiken."

De deur openen

De ontwikkeling van open-source AI zou kunnen helpen om de potentieel baanbrekende kracht van de nieuwe technologie minder vatbaar te maken voor vooroordelen en fouten, beweren sommige waarnemers.

AI-onderzoek gebeurt nu voornamelijk in de open lucht, waarbij bijna alle bedrijven, onderzoekslaboratoria en universiteiten hun resultaten onmiddellijk presenteren in wetenschappelijke publicaties, vertelde Kush Varshney, een AI-onderzoeker bij IBM, aan Lifewire in een e-mailinterview.

"Deze open community is essentieel, omdat het verbeterde niveaus van checks and balances biedt om ervoor te zorgen dat AI op verantwoorde wijze wordt onderzocht, gecreëerd, ingezet en toegepast", voegde Varshney eraan toe. "Dit is vooral van cruciaal belang in situaties waarin deze systemen het leven van onze meest kwetsbare leden van de samenleving kunnen beïnvloeden. Deze openheid geldt niet alleen voor algemene machine learning en deep learning-algoritmen, maar ook voor elementen van betrouwbare AI."

Rehman zei dat een van de cruciale verschillen tussen propriëtaire en open-source software flexibiliteit en maatwerk is. Eigen AI-onderzoek zal problemen hebben met beveiliging, updates en optimalisaties.

Image
Image

"Dit komt omdat de open-source community-gebaseerde benadering waardevolle input krijgt van duizenden experts uit de industrie die potentiële beveiligingsproblemen identificeren die vervolgens sneller worden verholpen", voegde Rehman eraan toe."De consensus van de gemeenschap betekent dat kwaliteit wordt gegarandeerd en nieuwe kansen gemakkelijker worden geïdentificeerd."

Een ander probleem is dat eigen AI-onderzoek niet interoperabel zal zijn, wat betekent dat het niet met verschillende gegevensformaten kan werken en waarschijnlijk vendor lock-in zal hebben, waardoor bedrijven de software niet kunnen testen en uitproberen voordat ze zich verbinden tot een oplossing, zei Rehman.

Maar niet elk aspect van AI-onderzoek hoeft open-source te zijn, vertelde Chris Kent, de CEO van het medische AI-bedrijf Reveal Surgical, aan Lifewire in een e-mailinterview. "Het is belangrijk om de economische prikkels te beschermen die de commerciële ontwikkeling van belangrijke toepassingen van AI stimuleren", zei hij.

Onderzoek naar AI heeft echter een robuuste open-sourcecomponent nodig, zei Kent. Hij voegde eraan toe dat open source werkt om vertrouwen op te bouwen en datasets te gebruiken die niet worden of mogen worden beheerd door afzonderlijke instellingen of bedrijven.

"Een open-sourcebenadering is de beste manier om onderliggende vooroordelen die kunnen bestaan in trainingssets te identificeren en te compenseren en zal leiden tot meer holistische, creatieve en betrouwbare toepassingen van AI", zei Kent.

Aanbevolen: