JPMorgan vyvinula nový nástroj s názvom DocLLM, inteligentný jazykový model určený na porozumenie rôznym typom obchodných dokumentov. Na rozdiel od iných modelov sa DocLLM nespolieha na drahé obrazové technológie, ale namiesto toho sa zameriava na pochopenie štruktúry dokumentov identifikáciou a definovaním obdĺžnikov okolo dôležitých textových segmentov. Má unikátnu funkciu nazývanú disentangled spatial attention, ktorá mu umožňuje efektívne spracovať informácie v rámci špecifických oblastí dokumentu. DocLLM je obzvlášť účinný pri spracovaní dokumentov s nepravidelným rozložením a rôznymi typmi obsahu. Na trénovanie modelu použila spoločnosť JPMorgan údaje z dvoch hlavných zdrojov: IIT-CDIP Test Collection 1.0 a DocBank. Testy ukázali, že DocLLM prekonáva iné podobné modely pri rôznych úlohách súvisiacich s dokumentmi. Spoločnosť JPMorgan plánuje ďalej vylepšovať DocLLM začlenením funkcií súvisiacich s videním v odľahčenej podobe.
