Spoločnosť DeepSeek v spolupráci s univerzitou Tsinghua vyvíja samozdokonaľujúce sa modely umelej inteligencie známe ako DeepSeek-GRM, čo znamená generalistické modelovanie odmien. Cieľom tejto iniciatívy je zvýšiť efektívnosť modelov AI a zároveň ich lepšie zosúladiť s ľudskými preferenciami. Partnerstvo viedlo k vytvoreniu novej metódy posilňovania učenia, ktorá znižuje požiadavky na tréning modelov AI, čím sa znižujú prevádzkové náklady. Nový prístup, označovaný ako samočinné kriteriálne ladenie, preukázal v porovnaní s existujúcimi metódami lepšiu výkonnosť, pričom ju dosiahol s menším množstvom výpočtových zdrojov.
Pokroky spoločnosti DeepSeek’prichádzajú po tom, čo spoločnosť vyvolala vlny na trhu svojím nízkonákladovým modelom uvažovania AI, ktorý bol uvedený na trh začiatkom tohto roka. Nové modely budú sprístupnené na báze otvorených zdrojov, čo umožní ostatným vývojárom využívať tieto inovácie. Konkurenčné spoločnosti, ako napríklad Alibaba a OpenAI, tiež skúmajú zlepšenia v oblasti uvažovania a schopnosti samoregulácie v AI. Spoločnosť Meta Platforms nedávno vydala svoje modely AI Llama 4, ktoré využívajú architektúru Mixture of Experts, čím priamo konkurujú technológii DeepSeek. Hoci spoločnosť DeepSeek neoznámila konkrétny dátum vydania svojho ďalšieho vlajkového modelu, jej prebiehajúce výskumné a vývojové úsilie má predpoklady výrazne ovplyvniť prostredie AI.
