BLOOMChat: nový otvorený viacjazyčný chat LLM

Dokument predstavuje BLOOMChat 176B, viacjazyčný program LLM založený na chate. Model bol vyvinutý kombináciou syntetických konverzačných údajov a vysokokvalitných príkladov napísaných ľuďmi a následne vycvičený na súboroch údajov vytvorených ľuďmi Dolly 2.0 a OASST1. Schopnosť modelu’ viacjazyčného chatu a schopnosť vykonávať úlohy v rôznych jazykoch sa hodnotila prostredníctvom kvalitatívnych a kvantitatívnych meraní. BLOOMChat dosiahol v oboch experimentoch sľubné výsledky, pričom v prekladateľských úlohách prekonal iné varianty BLOOM a najmodernejšie open-source chatové modely. Model má obmedzenia, ako napríklad halucinácie a obmedzený výkon pri generovaní presného kódu alebo riešení zložitých matematických problémov. V dokumente sa tiež oceňuje prínos rôznych výskumníkov a open-source projektov k vývoju modelu BLOOMChat. Dokument poskytuje odkazy na súbory údajov použité pri experimentoch a vyzýva komunitu na diskusiu o BLOOMChate alebo na chat s tímom.

celý článok

Pridaj komentár