JPMorgan vyvíja generatívny jazykový model DocLLM na analýzu podnikových dokumentov

A sun-filled, cheerful drawing in cartoon style featuring a detailed, friendly robot assistant. The 3:2 aspect ratio image should show the robot busily examining and analyzing a complex business document in an office setting, with visual elements highlighting the structure and different segments of the document. The robot should be showcasing its 'disentangled spatial attention' by focusing on specific areas of the document. Scattered around are multiple documents with varying layouts and content types, indicating the ability of the assistant to deal with diverse documents. The scene should carry a positive vibe that reflects the innovation and efficiency brought about by the language model DocLLM.

JPMorgan vyvinula nový nástroj s názvom DocLLM, inteligentný jazykový model určený na porozumenie rôznym typom obchodných dokumentov. Na rozdiel od iných modelov sa DocLLM nespolieha na drahé obrazové technológie, ale namiesto toho sa zameriava na pochopenie štruktúry dokumentov identifikáciou a definovaním obdĺžnikov okolo dôležitých textových segmentov. Má unikátnu funkciu nazývanú disentangled spatial attention, ktorá mu umožňuje efektívne spracovať informácie v rámci špecifických oblastí dokumentu. DocLLM je obzvlášť účinný pri spracovaní dokumentov s nepravidelným rozložením a rôznymi typmi obsahu. Na trénovanie modelu použila spoločnosť JPMorgan údaje z dvoch hlavných zdrojov: IIT-CDIP Test Collection 1.0 a DocBank. Testy ukázali, že DocLLM prekonáva iné podobné modely pri rôznych úlohách súvisiacich s dokumentmi. Spoločnosť JPMorgan plánuje ďalej vylepšovať DocLLM začlenením funkcií súvisiacich s videním v odľahčenej podobe.

Celý článok

Pridaj komentár