P:
Com poden permetre les noves capacitats d'aprenentatge automàtic per a l'explotació de documents de borsa per a dades financeres?
R:Una de les noves fronteres apassionants de l'aprenentatge automàtic i l'AI és que científics i enginyers estan emprenent diverses maneres d'utilitzar tipus de recursos completament nous per predir els resultats de la circulació i la inversió. Es tracta d’un gran canvi de joc al món financer i revolucionarà les estratègies d’inversió d’una manera molt profunda.
Una de les idees bàsiques per ampliar aquest tipus d’investigació en accions és la lingüística computacional, que implica la modelització del llenguatge natural. Els experts investiguen com utilitzar documents de text, des de fitxers SEC fins a cartes d’accionistes fins a altres recursos perifèrics basats en text, per augmentar o afinar l’anàlisi d’accions o elaborar anàlisis completament noves.
Descàrrega gratuïta: Aprenentatge automàtic i per què és important |
L’important descàrrec és que tot això només es fa possible mitjançant nous avenços a les xarxes neuronals, l’aprenentatge automàtic i l’anàlisi del llenguatge natural. Abans de l’arribada de ML / AI, les tecnologies informàtiques utilitzaven sobretot la programació lineal per “llegir” les entrades. Els documents de text estaven massa desestructurats per ser útils. Però, amb els avenços realitzats en l'anàlisi del llenguatge natural durant els darrers anys, els científics troben que és possible "minar" el llenguatge natural per a resultats quantificables o, és a dir, amb resultats que es poden calcular d'alguna manera.
Algunes de les millors proves i exemples més útils d’això provenen de diverses dissertacions i treballs de doctorat disponibles al web. En un document, "Aplicacions de l'aprenentatge de màquines i la lingüística computacional en economia financera", publicat a l'abril de 2016, Lili Gao explica de manera capaç els processos rellevants específics per a l'explotació de fitxers SEC corporatius, trucades d'accionistes i missatges de xarxes socials.
"Extreure senyals significatives de dades de text no estructurades i d'alta dimensió no és una tasca fàcil", escriu Gao. "Tanmateix, amb el desenvolupament de tècniques lingüístiques d'aprenentatge automàtic i computacionals, es poden realitzar tasques de processament i anàlisi estadística de documents textuals i moltes aplicacions de l'anàlisi de text estadístic en ciències socials han demostrat tenir èxit". A partir de la discussió de Gao sobre modelització i calibració en resum, tot el document desenvolupat mostra com funciona amb detall aquest tipus d’anàlisi.
Altres fonts per a projectes actius inclouen pàgines com aquest breu del projecte de GitHub i aquest recurs de l’IEEE que parla específicament d’obtenir informació financera valuosa a partir de “l’anàlisi del sentiment de Twitter”.
El que és bàsic és que l’ús d’aquests nous models de PNL està impulsant la innovació ràpida en l’ús de tot tipus de documents de text, no només per a l’anàlisi financera, sinó per a altres tipus de descobriment d’avantguarda, que desdibuixa aquesta línia tradicionalment establerta entre “llengua” i "dades."