DeepSeek a Tsinghua vyvíjajú sebazdokonaľujúce sa modely umelej inteligencie

Visualize a vibrant scene showcasing the partnership between an AI tech company and a university. There's a large screen displaying intricate algorithms, symbolic of the self-improving AI model under development. Nearby, a Hispanic woman and a Middle-Eastern man, both scientists, analyzing data on their high-tech tablets. Depict the backdrop as the bustling floor of a high-tech open-plan office. Despite the competitive atmosphere suggested by monitors displaying logos of competitor companies, the two primary characters exhibit collaboration and determination in their expressions and body language. The overall composition should convey a sense of technological advancement and innovation.

Spoločnosť DeepSeek v spolupráci s univerzitou Tsinghua vyvíja samozdokonaľujúce sa modely umelej inteligencie známe ako DeepSeek-GRM, čo znamená generalistické modelovanie odmien. Cieľom tejto iniciatívy je zvýšiť efektívnosť modelov AI a zároveň ich lepšie zosúladiť s ľudskými preferenciami. Partnerstvo viedlo k vytvoreniu novej metódy posilňovania učenia, ktorá znižuje požiadavky na tréning modelov AI, čím sa znižujú prevádzkové náklady. Nový prístup, označovaný ako samočinné kriteriálne ladenie, preukázal v porovnaní s existujúcimi metódami lepšiu výkonnosť, pričom ju dosiahol s menším množstvom výpočtových zdrojov.

Pokroky spoločnosti DeepSeek’prichádzajú po tom, čo spoločnosť vyvolala vlny na trhu svojím nízkonákladovým modelom uvažovania AI, ktorý bol uvedený na trh začiatkom tohto roka. Nové modely budú sprístupnené na báze otvorených zdrojov, čo umožní ostatným vývojárom využívať tieto inovácie. Konkurenčné spoločnosti, ako napríklad Alibaba a OpenAI, tiež skúmajú zlepšenia v oblasti uvažovania a schopnosti samoregulácie v AI. Spoločnosť Meta Platforms nedávno vydala svoje modely AI Llama 4, ktoré využívajú architektúru Mixture of Experts, čím priamo konkurujú technológii DeepSeek. Hoci spoločnosť DeepSeek neoznámila konkrétny dátum vydania svojho ďalšieho vlajkového modelu, jej prebiehajúce výskumné a vývojové úsilie má predpoklady výrazne ovplyvniť prostredie AI.

Celý článok

Pridaj komentár