Per personal de Techopedia, 25 d’agost de 2016
Take away: La presentadora Rebecca Jozwiak discuteix el fenomen de les analítiques integrades i els científics de dades ciutadanes amb el doctor Robin Bloor, Dez Blanchfield i David Sweenor.
Per veure el vídeo, us heu de registrar en aquest esdeveniment. Registra't per veure el vídeo.
Rebecca Jozwiak: Senyores i senyors, hola i benvinguts a Hot Technologies. El tema és "Incorporar a tot arreu: habilitar el ciutadà de dades ciutadanes". Estic emplenant el vostre amfitrió habitual, es tracta de Rebecca Jozwiak que emplica Eric Kavanagh. Sí, aquest any fa calor. En particular, el terme "científic científic de dades" ha cridat molt l'atenció, tot i que solíem anomenar-los noms avorrits com "estadista" o "expert en analítica", que tracten pràcticament el mateix tipus d'activitats, però té un nom nou i atractiu. aconseguint molta atenció. És molt desitjable tenir-ho al lloc de treball, beneficiós per a l’organització, i tothom en vol. Però són: 1) cares, 2) difícils de trobar. Ja ho sabeu, han estat totes les notícies sobre l'escassetat d'habilitats del científic en dades, sí, però tot i així ofereixen un gran valor a l'organització i la gent és una mica clamant per esbrinar com obtenir aquest valor sense haver de deixar caure el cim. parlar
Però la bona notícia és que estem veient que surten eines i programari que compensen aquesta mancança. Disposem d’automatització, aprenentatge automàtic, analítica incrustada, que és el que anem a aprendre en l’actualitat i és el que ha donat lloc a aquest nou terme, “científic de dades ciutadanes”, i què vol dir això? No, no és el teu científic format per dades, pot ser el teu usuari empresarial, el teu expert en BI, algú d’informàtica, algú que tingui antecedents, però potser no necessàriament l’expertesa. Però el que fan, aquestes eines i el programari, és que permet a més gent accedir a aquestes solucions intel·ligents tot i que potser no coneixen la codificació profunda. Però simplement ajuda a millorar el rendiment en general quan ofereu a tots un accés més a aquest pensament analític. No cal que tingueu la formació necessàriament per tenir el tipus de curiositat que us pot proporcionar bones visions per a la vostra empresa.
Avui ens ho explica el nostre propi Robin Bloor, analista en cap del Grup Bloor, un dels més evidents científics de dades, que va demanar Dez Blanchfield, i David Sweenor, de Dell Statistica, ens presentarà avui. I amb això passaré a Robin Bloor.
Robin Boor: D'acord, gràcies per la introducció. Vaig pensar en això en un context històric. El que realment estem veient aquí és un dels dissenys de Leonardo da Vinci per a una mena de parapent que un home li podria posar a l'esquena. No tinc ni idea de si funcionaria. No m’hi faria, he de dir. Tanmateix, da Vinci, sempre que penso en da Vinci, penso en ell com una de les persones més curioses i analítiques que mai han existit. I està clar si només mira aquest planeador que està dissenyat sobre la base de l'ala d'un ocell i que, d'una manera o altra, ha estudiat els vols de les aus per tal de construir-lo.
Si analitzem la perspectiva històrica –de fet, he analitzat–, potser l’analítica és l’aplicació més antiga de les matemàtiques. Hi ha censos que es remunten almenys a l’època babilònica. Ho sabem perquè bàsicament hi ha algunes tauletes cuneïformes que tenen dades com aquesta. No se sap si hi havia alguna cosa que es retrocedís anteriorment. Però l’obviament és que tens una civilització amb una gran població de persones, en realitat requereix una planificació i val la pena saber per què estàs planificant i quins són els requisits d’aquestes persones.
I allà va començar allà i també on va començar la informàtica perquè realment els primers ordinadors, les primeres computadores mecàniques, crec que el primer va ser el cens creat per Hollerith, que es va convertir en IBM. Tot plegat ha avançat. Hi ha hagut algun tipus d’interludi entre la dècada de 1970 i l’actualitat, en què hi ha un gran nombre d’altres aplicacions i analítiques, podríeu dir, van ocupar el seient posterior. Sí, hi havia anàlisis que passaven (passava en grans organitzacions, particularment bancs i companyies d’assegurances, i en realitat General Electric i telco i coses així), però no s’utilitzava generalment a tot el negoci i ara comença a utilitzar-se generalment. negocis. I ha canviat el joc, de veritat. El primer que vaig pensar que cridaria l’atenció és la piràmide de dades, que m’agrada especialment. Això és, vull dir, vaig dibuixar un d’aquests fa 20 anys –almenys fa vint anys– per intentar entendre, realment, en aquell moment, estava intentant entendre la BI i algunes de les primeres dades d’explotació de dades que s’estaven fent. El que he definit aquí és la idea de dades i els exemples són senyals, mesuraments, enregistraments, esdeveniments, transaccions, càlculs, agregacions, punts d'informació individuals. Podríeu pensar en elles com a molècules d'informació, però són punts puntuals. Es converteix en informació tan aviat com en context. Dades enllaçades, dades estructurades, bases de dades, visualització de dades, traçadors, esquemes i ontologies: tots consideren una informació perquè el que heu fet és agrupar molta varietat i crear una cosa molt més que un punt de dades, una cosa que en realitat té una forma, una forma matemàtica.
Per damunt d’això tenim coneixement. Podem, examinant informació, podem aprendre que hi ha diversos patrons i podem aprofitar aquests patrons formulant regles, polítiques, directrius, procediments i aleshores pren la forma de coneixement. Gairebé tots els programes informàtics, siguin els que facin, són coneixements d'un tipus, ja que estan treballant contra dades i aplicant regles. Tenim aquestes tres capes i hi ha un refinament creixent que continua entre les capes. A la part esquerra d'aquest diagrama se us mostren dades noves, de manera que moltes d'aquestes coses són estàtiques. Les dades s’acumulen, la informació s’acumula i el coneixement potencialment està creixent. Al capdamunt, tenim "Comprensió" i mantindria, tot i que és un argument filosòfic, que la comprensió només resideix en els éssers humans. Si m'equivoco d'això, en algun moment serem substituïts per ordinadors. En lloc de tenir el debat, passaré a la següent diapositiva.
Quan vaig mirar això, l’interessant, això és recent, l’interessant era intentar esbrinar què eren realment les analítiques. I, finalment, dibuixant diversos esquemes i acabant amb un que semblava així, vaig arribar a la conclusió, de fet, el desenvolupament d’analítica és realment un desenvolupament de programari amb una quantitat horrible de fórmules matemàtiques. L’exploració analítica és una mica diferent al desenvolupament de programari en el sentit que realment agafaria molts i molts models diferents i els investigaria per tal de generar nous coneixements sobre dades. Però, un cop l’has generat, s’implementa en allò que penso com a suport de decisió passiu, que és informació que només proporciona als usuaris; suport interactiu de decisions, com OLAP, on l’usuari ofereix un conjunt estructurat de dades que poden investigar i deduir coses per si mateix mitjançant les diferents eines disponibles. Molta visualització és així. I aleshores tenim automatització si només podeu convertir una visió analítica que heu recollit en un conjunt de regles que es poden implementar, no necessàriament necessiteu que un ésser humà s’hi impliqui. Aquest és el tipus de manera que ho vaig mirar quan vaig fer tot això. I em van començar a ocórrer diverses coses. Un cop un àmbit d’activitat, direm, una vegada que un domini de dades és minuït, minuït, explorat a fons a través de totes les direccions possibles, acabant per convertir-se en una BI. El coneixement que s’inventa comença a convertir-se en coneixement que informa a diversos usuaris de diverses maneres i augmenta la seva capacitat, amb l’esperança, de fer el treball que realitzen.
Una de les coses que vaig observar i que he analitzat els analítics predictius durant uns cinc anys, però l’analítica predictiu s’està convertint en BI, en el sentit que s’està convertint en informació útil per alimentar a la gent i com ja he apuntat, Hi ha informes de BI automatitzats, exploracions de BI, BI, graduacions molt diferents i analítica predictiu en realitat van en les tres direccions. I el procés analític tal com vaig assenyalar no és tan diferent al desenvolupament de programari, tan sols fet per diferents persones amb habilitats lleugerament diferents. Suposo que hauria de subratllar que les habilitats necessàries per fer que un científic de dades realment bo triga anys a adquirir-se. No s’adquireixen fàcilment i no es pot fer un gran nombre de persones, però és perquè implica comprendre les matemàtiques a un nivell molt sofisticat per saber què és vàlid i què no és vàlid. Desenvolupaments d’analítica, descobriment de nous coneixements, implantació d’analítica, es tracta de fer que el coneixement sigui operatiu. Aquest és el tipus de teló de fons que veig al conjunt de les analítiques. És una zona enorme i hi ha moltes, moltes dimensions, però crec que la generalització s'aplica a tot.
Aleshores hi ha la interrupció del negoci, com he comentat, hi ha diverses organitzacions, les companyies farmacèutiques és una altra, que tenen en el seu ADN analítics. Però hi ha moltes organitzacions que realment no el tenen en el seu ADN, i ara tenen la capacitat, ara el programari i el maquinari són molt més barats del que solia ser, ara tenen la capacitat d'explotar-lo. Diria diverses coses. El primer és que l’analítica és, en molts casos, d’R + D. Pot ser que només apliqueu analítiques a una àrea específica de l'organització i us sembli mundà que, d'una manera o altra, analitzeu de nou les comandes del client des de diverses perspectives, unint-les a altres dades. Però les analítiques creen la possibilitat de mirar l'organització en general i analitzar gairebé qualsevol activitat que es desenvolupa dins de l'organització i cadenes d'activitats senceres. Però, un cop passés a aquesta àrea, mantindria que és investigació i desenvolupament. I hi ha una pregunta que m’han preguntat un parell de vegades, és a dir: “Quant hauria de gastar una empresa en analítica?” I crec que la millor manera de pensar en proporcionar una resposta és pensar en analítiques com en R + D., i només pregunta: "Bé, quant gastaria en R + D en l'àmbit de l'eficiència del negoci?"
I les empreses que no tenen analítica, hi ha moltes coses que no saben. En primer lloc, no saben com fer-ho. Normalment, si realment van a una o altra forma, adopten analítiques dins de l'organització, realment no tenen més opció que acudir a una consultoria que els pugui ajudar a fer-ho, perquè seria impossible o realment molt difícil per a la majoria les empreses contracten un científic de dades, en troben un, en paguen i en confien en ells per fer el que vulgueu. Molt difícil. La majoria de les empreses no saben com contractar o educar personal per fer aquest treball, i la raó és simplement que encara no és al seu ADN, per la qual cosa no forma part dels seus processos naturals de negoci. D’aquesta manera s’introdueix el punt següent. No saben com convertir-lo en un procés empresarial. La millor manera de fer-ho, per cert, és copiar el que les companyies farmacèutiques i les companyies d’assegurances, només cal mirar, i algunes empreses del centre d’atenció mèdica, només cal mirar la manera d’utilitzar les analítiques i copiar-les. Perquè és un procés empresarial. No sabeu com controlar-la ni auditar-la. Això és realment, sobretot ara que una gran quantitat d’empreses de programari han creat productes que automatitzen una gran quantitat d’analítica. El punt sobre l’auditoria és important quan teniu una consultoria o algú del lloc que es pugui confiar per entendre quins són els resultats de qualsevol càlcul analític, és una mena d’elecció que heu de fer, però si poseu eines d’anàlisi realment potents les mans de gent que no entén bé les analítiques és probable que arribin a conclusions que potser no són correctes. I com he dit, les empreses no ho saben pressupostar.
Aquests són els sabors de les analítiques, només els passaré. L’analítica estadística i el modelatge estadístic són significativament diferents de les analítiques predictius, la majoria de les quals, per cert, s’ajusten a la corba. L’aprenentatge automàtic és diferent a les coses, les analítiques de ruta i les sèries de temps, que bàsicament es fan de nou en els fluxos d’estat. L’analítica de gràfics torna a ser diferent, i l’analítica de text i l’analítica semàntica tornen a ser diferents. Això només està remarcant que es tracta d’una cosa molt multi-gènere. No és, no comenceu a fer analítiques, comenceu a mirar problemes que teniu i busqueu les diverses eines i diversos sabors d’analítica que s’adapti a aquestes. I finalment, el net net. A causa de l'evolució del maquinari i del programari, al meu parer, l'analítica està en la seva primera infància. Hi ha molt, encara molt més, i ho veurem com es desenvoluparà en els propers anys. Crec que ara puc passar la pilota a Dez.
Dez Blanchfield: Sí, parla d'un fet dur a seguir, Robin. Visitaré aquest tema breument des d’un dels meus angles preferits, que és l’angle de l’ésser humà. Hi ha tants canvis en la nostra vida quotidiana. Una de les majors interrupcions del nostre dia a dia, actualment, segons el meu parer, és només el treball diari. Posar-vos a la feina i intentar fer la feina que heu contractat i l'expectativa creixent que aneu d'una persona quotidiana a un superheroi i la quantitat d'informació que flueix per les organitzacions i emet molt, molt ràpidament, és un repte important i cada vegada més hem de proporcionar eines millors i millors a les persones per intentar afrontar el flux de coneixements i informació i, per tant, vaig pensar que ho provaria des d'un angle divertit. . Però, sempre em crida l’atenció com tenim aquests telèfons intel·ligents o flash, etcètera, que ens condueixen cap a allò que parlem d’analítica, però realment del que parlem és posar a l’abast la informació a la gent i que els permeti interactuar i fer-ho de manera que sigui natural i que se senti normal.
I de fet, em recorda un vídeo de YouTube d'un nen petit, petit, assegut al terra i allà està assegut jugant amb un iPad i fa voltes, pessiga, esprèn i mena les imatges i juga amb la pantalla, les dades allà Aleshores, el progenitor treu l’iPad i posa una revista, una revista impresa a la falda del nen. I és probable que aquest nen no tingui més de dos anys. El nen comença a intentar relliscar amb la pantalla de la revista, a pessigar i apretar i la revista no respon. El nen aixeca el dit i el mira i pensa: "Hmm, no crec que funcioni el meu dit", i es posa al braç i pensa: "Ah no, treballant el dit que puc sentir del meu braç i això té un aspecte bo ”, i fa malbé el dit, i el dit s’arruga i respon. Sí. A continuació, intenta interactuar de nou amb la revista, i baixa i mira que no pessiga ni esprèn i es desplaça. Després es treuen la revista i tornen a posar l’iPad a la falda i, de sobte, tot funciona. I aquí teniu un nadó que ha vingut format per utilitzar una eina analítica o una eina de reproducció en directe per entreteniment, i no pot treballar com hauria de funcionar una revista i com han de volar les pàgines.
I això és un concepte interessant en si mateix. Però quan penso en el coneixement del moviment per les organitzacions i la manera com flueixen les dades i la manera com es comporten les persones, sovint penso en aquest concepte del que les persones han après a ser un flash mob, que és un esdeveniment on, i que fan els mitjans socials encara més fàcil de fer, una idea com a tal és anar a aquest lloc en aquest moment i data i acció, o fer vídeo i aprendre aquestes danses, o portar aquest barret de colors i apuntar cap al nord a la una en punt. I ho feu fora a través de la vostra xarxa i, invariablement, un munt de persones, centenars d'ells, apareixen al mateix lloc alhora que feu el mateix i hi ha aquest factor wow, com ara: "Santa vaca, que era realment impressionant! ”Però en realitat es tracta d’una idea senzilla i un concepte senzill només s’emporta a través de les nostres xarxes i obtenim aquest resultat que és una cosa visualment sorprenent i impressionant. I quan penses en una organització, la manera com volem que les persones es comportin i la manera en què volem que tractin amb sistemes d’informació i clients, sovint és tan senzill, és una idea o un concepte o un tret cultural o de comportament que intentem passar. a través i apoderament amb eines i informació.
I basant-nos en tot aquest mantra que he tingut durant més de dues dècades i mitja i és a dir, si el vostre personal no pot trobar el que necessita per fer la seva feina, ja sigui eines o informació, invariablement reinventaran la roda. Així que ara és un repte cada vegada més gran, on tenim molts coneixements i molta informació i coses que es mouen molt ràpidament, que volem deixar de reinventar la gent. I quan pensem en el nostre entorn de treball, tornant a l’angle de la gent, que és un dels meus preferits, em va sorprendre quan ens va sorprendre que els cubicles no fossin un entorn propici per obtenir bons resultats, o bé alliçàvem coses tan horribles. imatges aquí, i no ha canviat gaire, només baixar les parets i anomenar-les espais oberts de treball. Però al mig amb el llaç groc al seu voltant, hi ha dues persones que intercanvien coneixements. I, tanmateix, si ens fixem en la resta de l'habitació, hi estan tots asseguts allà, colpejant amb molta seguretat allà mateix, posant informació en una pantalla. I, sovint, no intercanvieu realment coneixements i dades, i hi ha diverses raons per això. Però, a la interacció que hi ha al mig del pis de l’esquerra, al cercle groc, hi ha dues persones que xerren allà, intercanvien coneixements i probablement intenten trobar alguna cosa, intentant dir: “Sabeu on es troba aquest informe, on jo Puc trobar aquestes dades, quina eina faig servir per fer això? ”I probablement no ha funcionat perquè no tinguin res, i vagin per terra, trenquessin la regla de l’espai d’oficines del cubicle i ho fessin en persona.
I hem tingut entorns semblants al voltant de l’oficina que de broma ens diverteixen, però la realitat és que són força potents i eficaços. I un dels meus preferits és la plataforma d’anàlisis mòbil o fixa anomenada water cooler, on la gent s’aixeca allà i xit-chat per allà i canvia coneixements, comparen idees i realitzen analítiques mentre es troben al refrigerador d’aigua, intercanvien idees. Són conceptes molt potents quan hi penseu. I si els podeu traduir als vostres sistemes i eines, obté un resultat sorprenent. I tenim el favorit de sempre, que és essencialment el centre de distribució de dades més potent de l’oficina, també conegut com a recepció. I si no trobeu alguna cosa, cap a on aneu? Doncs camines cap a la part davantera de l’oficina i vas a la recepció i dius: “Sabeu on és x, y, z?” I m’atreveixo a algú que em digui que no ho han fet almenys una vegada per una nova. feina o en un moment en què simplement no poden trobar alguna cosa. I us heu de preguntar, per què són els casos? Hauria d’estar en algun lloc de la intranet o d’alguna eina o qualsevol altra cosa. Hauria de ser fàcil de trobar.
Així doncs, quan es tracta de dades i d’analítiques i de les eines que hem proporcionat al nostre personal per fer la seva feina i la forma en què els humans interactuen amb les feines, he tingut la idea que abans de la recent aparició d’eines d’analítica i plataformes de big data. o bé, el "processament de dades", que també ho anomenem a la vella escola, els informes i l'intercanvi de coneixement estava lluny de ser dinàmic o col·laboratiu o obert, i quan penses en el tipus de sistemes amb què esperem que la gent faci la seva feina, teníem clàssica, amb què la gent diu ara heretat, però la realitat és que només hi ha el llegat que encara es troba i encara avui aquí, i per tant, no és realment heretat. Però els sistemes tradicionals de recursos humans i sistemes ERP: gestió de recursos humans, planificació de recursos empresarials, gestió de dades empresarials i sistemes que utilitzem per gestionar la informació per dirigir una empresa. Invariablement silencia. I des de la part superior, plataformes simples com les intranets departamentals, que intenten comunicar on són les coses i com aconseguir-les i com interactuar amb el coneixement al voltant. Sortim a la nostra intranet. És tan bo com la gent que fa temps i esforç per posar-la allà, en cas contrari, només et queda al cap. O bé, teniu dades assegudes fins a la part inferior de la cadena alimentària, als SANs corporatius i tot el que hi ha entremig, de manera que les xarxes d’àrea d’emmagatzematge estan plenes d’arxius i dades, però qui sap on trobar-la.
Sovint, hem creat aquestes plataformes tancades de dades o sistemes tancats, de manera que la gent ha revertit en els gustos de fulls de càlcul i PowerPoints per transmetre informació al voltant. Però hi havia una cosa interessant que va tenir lloc recentment, i és que els dispositius mòbils i internet funcionen de manera generalitzada, amb la idea que les coses podrien ser millor. I predominantment a l’espai de consum. I és interessant que a la vida quotidiana comencem a tenir coses com ara la banca per Internet. No havíem d’anar físicament a un banc realment per interactuar amb ells, ho podríem fer per telèfon. Originalment, això era maldestre, però tot seguit es va produir internet i vam tenir un lloc web. Ja ho sabeu, i quantes vegades heu estat al vostre banc últimament? En realitat no puc, vaig conversar sobre això l'altre dia i, realment, no recordo la darrera vegada que vaig anar al meu banc, que em va quedar molt xocat, vaig pensar que deuria ser capaç de recordar-ho, però va ser molt llarg fa temps que realment no recordo quan vaig anar-hi. I ara tenim aquests aparells a la mà en forma de mòbils i telèfons, tauletes i ordinadors portàtils, tenim xarxes i accés a eines i sistemes i a l’espai de consum hem après que les coses poden ser millors, però perquè del ràpid canvi d'espai de consum que ha estat més letàrgic i de canvi glacial dins l'empresa i entorns, no sempre hem fet aquest canvi a la vida laboral quotidiana.
I m'encanta fer passar el divertit pel fet que no es poden reproduir les dades de transmissió en format fotogràfic. En aquesta imatge, hi ha una persona asseguda mirant algunes analítiques que es realitzen i hi ha un bonic gràfic que ha elaborat algú que probablement paga molts diners com a estadístic o com a actuari i hi està assegut intentant fer-ho. analítiques a una imatge impresa Però aquí és el temible: per exemple, aquesta gent de la sala de reunions, i ho faré servir com a exemple, interactuen amb dades que ja són històriques. I és tan antic de quan es va produir i es va imprimir allò, així que potser és un informe d'una setmana. Ara estan prenent decisions sobre dades no tant dolentes, sinó dades antigues, la qual cosa sempre pot ser mala informació. Avui prenen una decisió basada en alguna cosa històrica, que és un lloc realment dolent. Hem aconseguit substituir aquesta imatge impresa per tauletes i telèfons, com que hem treballat molt ràpidament a l'espai del consumidor, i ara l'hem treballat a l'espai empresarial, que el temps real és una visió del temps real.
I cada vegada estem millorant. I em porta al punt que Robin va plantejar abans, que era el concepte del científic de dades ciutadanes i l’impuls d’aquest concepte. Per a mi, un científic de dades ciutadanes només és gent habitual que tingui eines i informació adequades sobre els gustos d'un iPad. No han de fer les matemàtiques, no han de conèixer els algoritmes, no han de saber aplicar els algoritmes i reglar dades, sinó que només han de saber utilitzar la interfície. I això em torna a la meva introducció i al concepte del nen que s’hi asseu amb un iPad vers una revista, o un iPad. El nen petit pot aprendre de manera intuïtiva i ràpida com utilitzar la interfície d’un iPad per submergir-se en informació i interactuar amb aquesta, encara que potser sigui un joc o un streaming de mitjans o un vídeo. Però no podia obtenir la mateixa resposta o interacció d’una barra de revistes i només parpellejar pàgina rere pàgina, que no és gaire atractiva, sobretot si sou un nen petit que ha crescut amb iPads. Invariablement, els éssers humans poden mirar i aprendre molt ràpidament com conduir eines i coses que si només les proporcionem i si els proporcionem una interfície com els dispositius mòbils i, en particular, tauletes i telèfons intel·ligents amb pantalles prou grans, i sobretot si es pot interactuar al tacte, amb moviments de dit, de sobte, s’aconsegueix aquest concepte de científic de dades ciutadanes.
Algú que pugui aplicar ciències de dades amb les eines adequades, però sense haver de saber fer-ho. I en la meva ment, una gran part d’això, com deia, va ser impulsada per la influència dels consumidors, que es va transformar i transformar en demanda i empresa. Un parell d’exemples realment ràpids. Nosaltres, molts de nosaltres començaríem a fer coses amb els nostres blocs i llocs web, com ara publicar pocs anuncis o mirar el seguiment i el moviment, vam utilitzar eines com Google Analytics i ens vam despertar al fet que als nostres blocs i petits llocs web, podríem introduir codis de codi allà dins i Google ens donaria informació en temps real sobre qui visita el lloc web, quan i on i com. I, en temps real, podríem veure que la gent va accedir al lloc web, passar les pàgines i després desaparèixer. I va ser força sorprenent. M’encanta fer-ho encara quan intento explicar les analítiques en temps real a les persones que m’ho passo a mostrar només un lloc web amb Google Analytics connectat i realment veig la interacció en directe amb la gent que colpeja llocs web i els pregunto: “Imagineu-vos si vau conèixer aquest tipus de dades sobre el vostre negoci en temps real. "
Poseu un exemple al detall i potser un producte farmacèutic, crec que l’anomeneu una botiga de drogues a Amèrica, una farmàcia on hi aneu i compreu tot, des de comprimits per mal de cap fins a crema i barrets. Intentar executar aquesta organització sense informació en temps real és un concepte terrorífic, ara ja sabem el que sabem. Per exemple, podeu mesurar el trànsit de peus, podeu posar dispositius a la botiga amb un rostre somrient a un costat de la pantalla perquè esteu contents, i un vermell infeliç a l'extrem dret i alguns matisos diferents al centre. I hi ha una plataforma anomenada "Happy or Not" en aquests dies, on us endinseu en una botiga i podreu colpejar una cara feliç o una cara trista, segons el vostre feedback en viu del sentiment dels clients. I això pot ser interactiu amb temps real. Podeu obtenir preus basats en demanda en directe. Si hi ha molta gent, podeu augmentar una mica els preus i podeu fer disponibilitat en estoc i dir-li a la gent, per exemple: les companyies aèries, per exemple, diran a la gent quants seients hi ha disponibles al lloc web quan reserveu un vol, no simplement marqueu a l'atzar i espereu que pugueu obtenir i obtenir un vol. Dades de recursos humans en directe, que es pot indicar quan la gent està vigilant i quan funciona. A la contractació, si teniu contractació i teniu dades en directe, podríeu fer coses com esperar una hora i cobrir el preu del dòlar nord-americà per comprar la vostra propera càrrega d’accions i tenir una càrrega de camions.
Quan mostro a Google Analytics a la gent i em transmet aquest tipus d’anècdota, aquest moment eureka, aquest moment “a-ah!”, Aquesta bombeta em queda a la ment com: “Hmm, puc veure un munt de llocs on podria fer-ho. . Si només tingués les eines i si només tingués accés a aquest coneixement. ”I ho estem veient a les xarxes socials. Qualsevol que sigui un usuari de mitjans de comunicació social que no sigui només mostrar fotos del seu esmorzar, tendeix a mirar quants agrada obtenir i quant trànsit i quants amics estan aconseguint, i ho fan amb el de Twitter, com ara una eina d’anàlisi. Podeu anar a Twitter.com per utilitzar l'eina, però escriviu Google com Google Point Analytics com, o feu clic al botó superior dret i traieu el menú i feu-ho, obteniu aquests bonics gràfics en viu que us indiquen quants. tuits que estàs fent tu mateix i quantes interaccions amb ells. I analítiques en temps real només a les vostres xarxes socials personals. Imagineu-vos si teníem els gustos de Google Analytics, Facebook i LinkedIn i Twitter, les estadístiques d’eBB us presenten, però al vostre entorn laboral.
Ara tenim al nostre abast un tipus de web i mòbil en directe, que es converteix en un concepte de potència. I això em fa arribar a la meva conclusió, i és que, invariablement, he descobert que les organitzacions que utilitzen les eines i la tecnologia de forma primerenca, obtenen un avantatge tan important respecte als seus competidors que els competidors en realitat mai no podran posar-se al dia. I ho estem veient ara amb el conflicte del científic científic de dades. Si podem agafar persones amb les habilitats, els coneixements pels quals els contractem i els podem donar les eines adequades, especialment la capacitat de veure les dades en temps real i de descobrir dades i saber on es troba sense haver de caminar pels cubics. i fer preguntes en veu alta, havent d’anar a parar a la refrigeració d’aigua per fer algunes analítiques comparatives amb la gent o anar i preguntar a la recepció on es troba l’índex. Si ho poden fer a l’abast de la mà i poden portar-los a les reunions amb ells i seure a una sala de juntes fent-se passar per les pantalles en temps real en lloc de còpia impresa, de cop i volta hem donat poder al nostre personal que no necessita ser real. científics de dades, però en realitat utilitzar la ciència de dades i obtenir resultats sorprenents per a les organitzacions. I crec que aquest punt d’inversió que hem passat ara en què el consumidor està dirigit a l’empresa, el repte és com proporcionem aquesta empresa i aquest és el tema que suposo de la discussió d’avui. I amb això, vaig a embolicar la meva peça i lliurar-la per escoltar com podríem resoldre això. David, a sobre.
David Sweenor: D'acord, moltíssimes gràcies, i gràcies Robin. Sabeu, Robin, estic d'acord amb la vostra valoració original. El procés analític, en realitat, no és diferent del desenvolupament de programari. Crec que el repte d'una organització és realment, ja ho sabeu, potser les coses no estan tan ben definides, potser hi ha un component exploratori i un component creatiu per a això. I Dez, ja ho sabeu, estic d’acord amb vosaltres, hi ha molt que reinventeu la roda i, ja ho sabeu, no hi ha una organització a la qual entri avui, us pregunteu, doncs, per què ho feu així? Per què el negoci funciona així? I és fàcil de qüestionar-ho, i moltes vegades quan estàs dins d’una organització, costa canviar. M'encanta l'analogia, la consumització de les coses. I ja no quan vaig a l'aeroport i vull canviar de seient, ho faig des del mòbil. No he d’anar a l’agent de la cabina i veure que l’agent escriu alguna cosa en un monitor monocrom durant 15 minuts per canviar l’assignació de seient. Prefereixo fer-ho al meu telèfon i, per tant, és un desenvolupament interessant.
Avui parlarem una mica sobre intel·ligència col·lectiva. Per a aquells que no en saben, Statistica és una plataforma d’anàlisi d’avantguarda, que fa més de 30 anys. Si observeu alguna de les publicacions que hi ha a la indústria d’analistes, sempre surt com a un dels paquets de programari d’analítica avançada més intuïtius i fàcils d’utilitzar. Des de fa uns quants anys hem treballat en un concepte anomenat intel·ligència col·lectiva i el portem al següent nivell. Volia iniciar aquesta conversa amb: Com es treballa el treball a la vostra organització?
I aquí hi ha dues imatges. La de l’esquerra és una imatge dels anys seixanta i no vaig començar la meva carrera als anys seixanta, però la de la dreta és: és una fàbrica de semiconductors on vaig començar a treballar. I vaig treballar a aquell edifici negre, al terrat negre de la part superior esquerra. Però feien coses de semiconductors. Aquesta és una imatge recent de Google Images. Però quan es torna a la imatge dels anys seixanta a l’esquerra, és molt interessant. Tens aquesta gent asseguda en una línia i està formant, ja ho sabeu, circuits integrats i semiconductors. Però hi ha una normalització, hi ha una manera estàndard de fer les coses i hi havia un procés ben definit. Ja ho sabeu, potser ja que totes aquestes persones estan assegudes en un entorn obert, potser hi va haver una certa col·laboració. Crec que hem perdut una mica d’això en la força de coneixement.
Quan vaig seure a l’edifici de la part superior esquerra, si volia col·laborar amb algú, no estava obert. Hi havia aquestes oficines, potser part de l’equip estava remot, o potser vaig haver de trepitjar aquest campus; era un passeig de 25 minuts i hauria d’anar a parlar amb algú de l’edifici de l’extrem dret. Crec que hem perdut alguna cosa pel camí. Aleshores, ja sabeu, el mateix pensament és, per què la gent: quantes persones reinventen la roda dins de l'organització? Crec, ja ho sabeu, que les organitzacions en conjunt van fer una bona tasca als anys 90 i 2000 amb CRM i magatzem de dades, i fins a cert punt BI. Per algun motiu, l’analítica s’ha endarrerit una mica. Hi ha hagut inversions importants en l’emmagatzematge de dades, i estandarditzar i normalitzar les vostres dades, i tot això, i CRM, però l’analítica ha quedat per algun motiu. I em pregunto per què. Potser hi ha un missatge creatiu, potser el vostre procés no està ben definit, potser no sabeu quina decisió o palanca tracteu de convertir, ja sabeu, al vostre negoci per canviar les coses. Avui quan entrem a organitzacions, hi ha molta gent que fa les coses de manera molt manual en fulls de càlcul.
I ja sabeu, he mirat una estadística aquest matí, crec que deia que el 80% del full de càlcul té errors i alguns poden ser molt significatius. Com la de Whale, on JPMorgan Chase va perdre milers de milions i milers de milions de dòlars a causa d’errors de full de càlcul. Així doncs, crec que hi ha la premissa de millorar les coses. I com hem comentat, tenim aquestes dades científiques. Aquests nois són cars i són difícils de trobar. I de vegades són una mica d’ànec. Però crec que, si hagués de resumir el que és un científic de dades, és probable que algú entengui les dades. Crec que és algú que entén les matemàtiques, algú que entén el problema. I realment, algú que pugui comunicar els resultats. I si ets un científic de dades, tens molta sort en aquests dies, perquè el teu sou probablement s’ha duplicat en els darrers anys.
Però la veritat, a moltes organitzacions, no tenen aquestes dades científics, però la vostra organització té gent intel·ligent. Tens una organització, tens molta gent intel·ligent i fan servir fulls de càlcul. Ja sabeu, les estadístiques i les matemàtiques no són el seu treball principal, però utilitzen dades per impulsar el negoci. Realment, el repte al qual ens enfrontem és, com podeu prendre si teniu la sort de tenir un científic de dades o un estadístic o dos, com podeu agafar-los i com podeu millorar la col·laboració entre aquests? altres persones de la vostra organització? Si fem una ullada a com s’estructura la nostra organització, vaig a començar i aniré de dreta a esquerra. I sé que això és enrere, però tenim aquesta línia d’usuaris comercials.
Aquest és el gruix de la vostra població treballadora del coneixement i, per a aquestes persones, heu d'incorporar analítiques a la vostra línia d'aplicacions empresarials. Potser veuen sortida analítica a la pantalla del centre de trucades o alguna cosa, i els està dient la propera millor oferta per oferir a un client. Potser és un consumidor o un proveïdor en un portal web i els dóna crèdits a l’instant o coses així. Però la idea és que consumeixen analítiques. Si anem al centre, aquests són els treballadors del coneixement. Aquestes són les persones que fan les coses amb els fulls de càlcul actuals, però els fulls de càlcul són propensos a errors i en algun moment es queden sense gas. Aquests científics de dades ciutadanes, com els anomenem, ja ho sabeu, el que intentem fer per ells és realment augmentar el nivell d’automatització.
I escolteu amb analítics que entre el 80 i el 90 per cent de la feina és de la peça de preparació de dades, i no és la matemàtica real, sinó que és la preparació de dades. Intentem automatitzar això, tant si ho fas, com si tenim assistents i plantilles i coses reutilitzables, i realment no hauràs de tenir coneixement de la infraestructura subjacent del teu entorn. I llavors si ens fixem en l’extrema esquerra, tenim aquestes dades científiques. I, com he esmentat, tenen un subministrament curt. I el que estem intentant per fer-los més productius, és permetre'ls crear coses que poden fer aquests científics de dades ciutadanes. Penseu-hi com un bloc Lego, de manera que aquests científics de dades poden crear un recurs reutilitzable que pot utilitzar un científic de dades ciutadanes. Creeu-lo una vegada, de manera que no haurem de continuar reinventant la roda.
I, a més, aquests nois poden preocupar-se si podem fer coses a la base de dades i aprofitar les inversions tecnològiques existents que ha fet la vostra empresa. Ja sabeu, no té sentit en aquesta època i l'edat de barrejar dades a tot el món. De manera que si ens fixem en Statistica, com he esmentat, és una plataforma que fa força temps que es troba al voltant. I és un producte molt innovador. Combinació de dades, no hi ha hagut una font de dades a la qual no puguem accedir. Tenim totes les coses que us agradaria per descobrir i visualitzar dades; ho podem fer en temps real. I probablement ho tinc - crec que hi ha més de 16.000 funcions analítiques dins de l’eina de programari, de manera que és més matemàtic del que mai podria utilitzar o entendre, però hi és si ho necessiteu.
Tenim la capacitat de combinar tant les regles comercials com els fluxos de treball analítics per prendre una decisió empresarial realment. Voleu més enllà, només hi ha un algorisme, un flux de treball, però teniu unes regles de negoci que sempre heu d’afrontar. Estem molt segurs en el govern. Ens utilitzem en molts clients farmacèutics, ja que la FDA confia en nosaltres. Ja ho sabeu, només ho demostreu en el budell que tenim els controls i la capacitat d'auditoria per ser acceptats per ells. I, per últim, ja sabeu, som oberts i flexibles i extensibles, per la qual cosa heu de crear una plataforma que sigui, voleu que els vostres científics de dades siguin productius, voleu que els vostres científics de dades ciutadanes siguin productius, voleu ser capaços per implementar aquests resultats analítics als treballadors de la vostra organització.
Si hi fem un cop d’ull, aquí teniu un exemple d’algunes de les visualitzacions. Però poder distribuir la vostra sortida analítica als usuaris de la línia de negoci, així que el primer exemple a l'esquerra, és un diagrama analític de xarxa. I potser sou un investigador de fraus i no sabeu com es fan aquestes connexions, i poden ser persones, poden ser entitats, poden ser contractes, de veritat. Però podeu manipular-ho amb el ratolí i interactuar amb ell per entendre-ho realment, si sou un investigador de fraus, per entendre una llista prioritzada de qui haureu d’investigar, oi, perquè no podeu parlar amb tothom, així que prioritzar.
Si mirem la imatge del costat dret, per obtenir un tauler de manteniment predictiu, aquest és un problema realment interessant. Potser sou propietari d’un aeroport i teniu aquests escàners del cos allà dins. Aquests escàners corporals, si aneu a un aeroport, hi ha alguns components que tenen una vida útil de nou mesos. I aquestes coses són realment, realment cares. Si tinc diversos punts d’entrada, múltiples escàners al meu aeroport, el número un vull assegurar-me que tinc personal adequat a cadascuna de les portes, i tampoc vull ordenar-los per les parts que hi ha als escàners. d’hora i vull tenir-los abans que s’espatlli. Tenim capacitat, potser si teniu un aeroport, per predir quan es trencaran aquestes coses i predir els nivells de personal.
Si ens fixem en la part inferior dreta, si es tracta d’un entorn de fabricació, això és només una representació gràfica del flux de fabricació. I és lleugerament difícil de veure, però hi ha semàfors vermells i verds en aquests diversos sectors de processos, i per tant, si sóc enginyer, hi ha matemàtiques molt sofisticades, però puc aprofundir en aquest sector de procés i mirar els paràmetres i l’entrada que potser provoquen que es descontroli. Si ens fixem en el nostre científic científic de dades, el nostre objectiu és realment facilitar el científic de dades ciutadanes. Tenim assistents i plantilles, i una cosa que crec que és realment interessant, és que tenim aquest node de verificació de salut automatitzada de dades. I realment el que això fa, té smarts integrats.
He esmentat la preparació de dades: triguen una quantitat important de temps, això és tant a l’agregació de dades com a la preparació. Però suposem que tinc les meves dades, que puc fer servir a través d’aquest node de comprovació de la salut de les dades, i comprova la invariantia, la sensació d’extensió, i els valors superiors i, tot això, omple valors que falten i fa molta matemàtica que no. No ho entenc, per tant puc acceptar els valors predeterminats, o si sóc una mica més intel·ligent, puc canviar-los. Però la qüestió és que volem automatitzar aquest procés. Això fa uns 15 controls i resultats diferents en un conjunt de dades netejat. El que fem és facilitar a les persones la creació d’aquests fluxos de treball.
Aquí es parla de col·laboració entre científics de dades i científics de dades ciutadanes. Si mirem aquestes imatges a la dreta, veiem aquest flux de treball de preparació de dades. I potser això és molt sofisticat, potser aquesta és la salsa secreta de la vostra empresa, no ho sé, però sabem que algú de la vostra organització pot accedir a una o més d’aquestes sitges de dades que tenim. Necessitem una manera de, número u, agafar-los i enganxar-los, i el número dos, potser hi ha processament especial que volem fer, que estigui fora del nostre control sanitari de dades i que sigui la salsa secreta de la vostra empresa. Puc crear aquest flux de treball dins de la nostra organització i es col·loca com a node. Veieu la fletxa que apunta cap avall, és només un node i podem tenir un centenar d’aquestes coses dins d’una organització. La idea és que tenim persones que saben alguna cosa sobre un espai determinat, poden crear un flux de treball i algú altre pot reutilitzar-ho. Estem intentant minimitzar la reinvenció de la roda.
I podem fer el mateix amb els fluxos de treball de modelatge analític. En aquest cas, a la dreta, aquest flux de treball, potser hi ha 15 algoritmes diferents i vull escollir el millor per a la tasca. I no he d’entendre com a científic de dades ciutadanes el que passa en aquell traster web spider allà, però només s’esfondra en un node, i potser aquell node simplement diu: “calcula la puntuació de risc de crèdit”. “Calcula la possibilitat. d'una infecció en un lloc quirúrgic ", què tens? "Calcula la probabilitat que alguna cosa sigui una transacció fraudulenta." Com a científic de dades ciutadanes, puc fer servir aquestes matemàtiques molt sofisticades que algú altre ha construït, potser un d'aquests científics de dades ha construït dins de la meva organització.
Des de la perspectiva de ciències de dades, ja sabeu, he parlat amb científics de dades a qui els agrada escriure codi i he parlat amb científics de dades que odien escriure codi. I està bé, de manera que tenim una interfície d’usuari gràfica molt visual. Podem agafar les nostres dades, podem fer la nostra revisió automatitzada de salut de les dades i potser vull escriure codi. A mi m’agrada Python, m’agrada la R, però la idea és que aquests científics de dades, tenen poca oferta i els agrada el codi en un idioma determinat. No tenim en cap preferència el llenguatge que voleu codificar, així que si voleu fer R, feu R; si voleu fer Python, feu Python. Això és genial. Si voleu rebentar les analítiques a Azure, feu servir les analítiques al núvol. Per tant, l'objectiu aquí és oferir flexibilitat i opcions perquè els vostres científics tinguin una productivitat molt productiva.
Els científics de dades, són gent bastant intel·ligent, però potser no són un especialista en tot, i potser hi ha algunes llacunes en el que poden fer. I si ens fixem en la indústria, hi ha molts mercats analítics diferents. Aquest és un exemple de, potser necessito fer reconeixement d’imatges i no tinc aquesta habilitat, bé potser surto a Algoritmia i tinc un algorisme de reconeixement d’imatges. Potser surto a Apervita i tinc un algoritme sanitari molt especial. Potser vull fer servir alguna cosa a la biblioteca d’aprenentatge de màquines d’Azure. Potser vull fer servir alguna cosa a la plataforma nativa Statistica.
Un cop més, la idea aquí és que volem aprofitar la comunitat d’analítica global. Com que no tindreu totes les habilitats dins de les vostres quatre parets, doncs, com podem crear programari –i això ho fem–, permet als científics de dades utilitzar algoritmes de diversos llocs de mercat. Ja fa temps que ho fem amb R i Python, però això s'estén a aquests mercats d'aplicacions existents. I el que veieu aquí a la part superior d’això, estem utilitzant H2O a Spark, de manera que hi ha molts algoritmes analítics. No us heu de centrar a crear-los des de zero, reutilitzem aquests que viuen a la comunitat de codi obert i volem que aquestes persones siguin el més productives possibles.
El següent pas, després que tinguem els nostres científics de dades ciutadanes i els nostres científics de dades, és realment com promocioneu i distribuïu aquestes bones pràctiques? Tenim tecnologia dins del nostre programari que permet distribuir analítiques a qualsevol lloc. I això és més que una visió de gestió de models, però ja no estic lligat per les quatre parets o per una instal·lació específica dins de Tulsa o Taiwan o Califòrnia, o què hi ha. Aquesta és una plataforma global i tenim molts i molts clients que està desplegada en el seu ús per diversos llocs.
I, realment, les coses més importants són: si fas alguna cosa a Taiwan i vols replicar-ho al Brasil, és fantàstic. Entra allà, agafa les plantilles reutilitzables, agafa els fluxos de treball que vulguis. Es tracta de crear aquests estàndards i la manera comuna de fer les coses, de manera que no fem coses completament diferents a tot arreu. I l’altra component clau d’això, és que realment volem portar les matemàtiques fins on viuen les dades. No heu de barrejar dades, ja ho sabeu, Califòrnia, Tulsa i Taiwan i Brasil. Tenim una tecnologia que ens permet portar les dades matemàtiques i anem a tenir una altra transmissió web de tecnologia calenta sobre aquest tema.
Però anomenem aquesta arquitectura, i aquí hi ha una meravellosa imatge, Arquitectura d'Analytics Distribuïts Natius. La idea clau que hi ha al darrere és que tenim una plataforma, Statistica, i puc exportar un flux de treball analític com a àtom. I podria fer un model, o un flux de treball complet, de manera que això no importa. Però puc crear-ho i exportar-lo en un idioma adequat a la plataforma de destinació. A la part esquerra d'això, molta gent ho fa, però fan puntuacions al sistema font. Està bé, podem fer puntuacions i podem crear models de bases de dades, així que és interessant.
I després al costat dret, tenim Boomi. Es tracta d’una tecnologia d’acompanyament, treballem amb tots aquests. Però també podem agafar aquests fluxos de treball i transportar-los fonamentalment a qualsevol part del món. Qualsevol cosa que tingui una adreça IP. I no he de tenir instal·lada una Statistica al núvol públic o privat. Qualsevol cosa que pugui executar una JVM, podem executar aquests fluxos de treball analítics, fluxos de treball de preparació de dades o només models en qualsevol d’aquestes plataformes objectiu. Ja sigui al meu núvol públic o privat, ja sigui al meu tractor, al meu cotxe, a la meva llar, a la meva bombeta, al meu internet de coses, tenim tecnologia que permet transportar aquests fluxos de treball a qualsevol part del món.
Repassem Ja ho sabeu, tenim una línia d'usuaris de negoci, així que aquestes persones, amb tecnologia, els permet consumir una sortida en un format amb el qual estan còmodes. Tenim científics de dades ciutadanes, i el que intentem és millorar la col·laboració, fer-los partícips d’un equip, oi? Així doncs, volem que la gent deixi de reinventar la roda. I tenim aquests científics de dades, hi podria haver una bretxa d’habilitats, però poden codificar en un idioma que vulguin, poden anar als mercats analítics i fer servir allà algoritmes. I amb això, com no podríeu pensar que tot és impressionant amb això? Això és perfecte, això és el que fem. Construïm fluxos de treball reutilitzables, donem instruccions a la gent, els donem els blocs Lego perquè puguin construir aquests castells poderosos i tot el que vulguin fer. Per resumir-ho, tenim una plataforma que capacita la línia d’usuaris de negocis, científics de dades ciutadanes, científics de dades de programadors, tenim: podem abordar qualsevol tipus d’ús d’analítiques de punta d’I IoT i estem habilitant aquesta noció d’intel·ligència col·lectiva. Amb això, crec que probablement l’obrirem per a preguntes.
Robin Bloor: Està bé. Crec que el primer, vull dir, per ser sincer, vull dir que m’han informat abans per Dell Statistica i, per ser sincer, realment estic força sorprès de les coses que no sabia que vau presentar a la presentació. . I he de dir que l’única cosa és que ha estat un problema per a mi en l’adopció d’analítiques, és que, ja ho sabeu, aconseguir les eines, no? Hi ha moltes eines horribles, hi ha eines de codi obert, etcètera, etcètera, i hi ha diverses, el que jo anomenaria, semi-plataformes. Però crec que la diferència que teniu, em va impressionar especialment alguns dels fluxos de treball.
Però la diferència és que sembla que proporcioneu punt a final. És com si l’analítica és un procés empresarial sofisticat que comença amb l’adquisició de dades i que després passa per una sèrie de passos, depenent de com són les dades descabellades i, després, es poden desglossar en tota una sèrie d’atacs matemàtics diferents. dades. I llavors els resultats sorgeixen d’una manera o d’una altra i cal que siguin accions. Hi ha una gran quantitat d’analítiques que he trobat en què es va fer molta feina, però no hi ha cap acció. I sembla que teniu una gran quantitat d’allò que cal. No sé com n'és de comprensiu, però és molt més comprensiu del que esperava. Estic increïblement impressionat amb això.
M'agradaria que comenteu els fulls de càlcul. Ja heu dit alguna cosa, però una de les coses que vaig assenyalar i que ho he notat amb els anys, però que cada cop es fa més evident, és que hi ha una gran quantitat de fulls de càlcul que són sistemes d'ombra i realment crec. vull dir que el full de càlcul va ser una eina meravellosa quan es va introduir i des de diverses maneres ha estat meravellós, però és una eina generalitzada, realment no és adequat. Certament no és gaire bo en el context de BI i crec que és horrible en el context d’analítica. I em vaig preguntar si teníeu algun comentari a fer, diguem-ne exemples en què, ja sabeu, ha estat esgotat Statistica, un ús excessiu de full de càlcul o algun comentari que voldríeu fer al respecte?
David Sweenor: Sí, crec que, ja ho sabeu, podeu anar a buscar famosos errors de full de càlcul. Google o qualsevol motor de cerca que utilitzeu obtindrà una letania de resultats. No crec que, ja ho sabeu, substituirem mai fulls de càlcul. No és la nostra intenció, sinó moltes organitzacions a les quals vaig, hi ha un parell d’aquests assistents o ninjas de full de càlcul o com vulgueu anomenar-los, però tenen aquests fulls de càlcul molt sofisticats i heu de pensar, què passa quan aquests la gent guanya la loteria i no torna? Aleshores, el que intentem és que sabem que existiran fulls de càlcul per tal que puguem ingerir-los, però crec que el que intentem és desenvolupar una representació visual del vostre flux de treball per tal que es pugui entendre i compartir amb altres persones. . Els fulls de càlcul són força difícils de compartir. I tan aviat em passes el full de càlcul per a mi, ho he canviat, i ara estem sense sincronització i obtenim respostes diferents. El que estem intentant és posar uns guàrdies al respecte i fer les coses una mica més eficients. I els fulls de càlcul són realment terribles a l’hora de combinar diversos conjunts de dades, ja ho sabeu? Allà cauen. Però no els substituirem, els ingerim i tenim persones que comencen a canviar-se perquè si tenim un node que diu “calcular el risc” és el que intenta fer la persona que utilitza el full de càlcul. Per tant, s'han anat.
Robin Bloor: Sí, vull dir, diria que, ja ho sabeu, des d’una perspectiva que miro les coses, diria que els fulls de càlcul són excel·lents per crear informació. Fins i tot són fantàstics per crear illes de coneixement, però són molt dolents per compartir coneixement. No tenen cap mecanisme per fer-ho i, si transmetes un full de càlcul a algú, no és com si ho puguis llegir com si fos un article que expliqués exactament el que fan. Simplement no hi és. Crec, ja ho sabeu, que el que més m'ha impressionat sobre la presentació i sobre les capacitats de Statistica, sembla ser increïblement agnòstic. Però té aquest fil funcionant amb un flux de treball. Tinc raó en suposar que podríeu veure un flux de treball de final a extrem, ja ho sabeu, des de l'adquisició de dades fins a la incorporació de resultats en aplicacions de BI concretes o fins i tot executant aplicacions?
David Sweenor: Sí, absolutament. I té aquesta capacitat de punta a punta i algunes organitzacions ho utilitzen íntegrament, i no em fa il·lusió que alguna empresa en aquests dies compri tot a un venedor. Tenim una barreja. Hi ha qui utilitza Statistica per a tot, i n'hi ha que l'utilitzen per als fluxos de treball de modelatge, algunes persones l'utilitzen per als fluxos de treball de preparació de dades. Hi ha qui l'utilitza per distribuir centenars d'informes d'enginyeria als enginyers. I així ho tenim tot. I és realment de punta a punta i és, ja ho sabeu, una plataforma agnòstica, ja que si hi ha algoritmes que voleu fer servir a R o Python, Azure, Apervita, qualsevol cosa, ja ho sabeu, utilitzeu-los. És fantàstic, sigueu productius, utilitzeu el que sabeu, utilitzeu el que us sentiu còmode i disposem de mecanismes per assegurar-nos que es controlin i siguin audibles i tot aquest tipus de coses.
Robin Bloor: M'agrada especialment aquest aspecte. Vull dir, no sé si es pot parlar més enllà del que heu dit a la riquesa del que hi ha. Vull dir, m’he fixat en això, però no l’he vist de manera exhaustiva i, certament, hi ha una gran quantitat de biblioteques Python a les nostres biblioteques, però hi podeu afegir alguna cosa a aquesta imatge? Com que crec que és una cosa molt interessant, ja sabeu, la idea que tindríeu components que fossin de confiança, ja que coneixíeu diverses persones que les havien creat i diverses persones que els utilitzaven. Ja ho sabeu, podeu enriquir el que ja heu dit al respecte?
David Sweenor: Sí, crec que alguns dels mercats d'aplicacions, ja ho sabeu, els mercats d'algoritmes que hi ha. Per exemple, ja sabeu, el doctor John Cromwell de la Universitat de Iowa, ha desenvolupat un model que predirà, que s’utilitza a temps real mentre s’està operant, us donarà una puntuació si voleu obtenir una infecció del lloc quirúrgic. I si aquesta puntuació és prou alta, faran una intervenció a la sala d’operacions. Això és molt interessant. Potser hi ha un altre hospital que no sigui tan gran. Doncs bé, Apervita és un mercat d'aplicacions sanitàries per a analítiques. Podeu anar a buscar-ne un en molts d’aquests mercats d’aplicacions, podeu cercar-ne una i tornar-los a utilitzar, i la transacció és entre vosaltres i qui en tingui, però podeu buscar-ne un o podeu dir: “Aquí Crec que està aprofitant aquesta comunitat global perquè tothom és un especialista en aquests dies i no ho pots saber tot. Crec que R i Python són una cosa, però aquesta idea de: "Vull fer aquesta funció, posar una especificació a un d'aquests llocs del mercat d'aplicacions i fer que algú la desenvolupi per a vosaltres". I poden obtenir diners amb això, crec. això és molt interessant i molt diferent que el model de codi obert.
Robin Bloor: D’acord . De totes maneres, passaré la pilota a Dez. Voleu submergir-vos, Dez?
Dez Blanchfield: Absolutament i m'agradaria quedar-me en el full de càlcul només per un moment, ja que crec que ha captat l'encert de moltes coses del que parlem aquí. Vau fer un comentari, Robin, sobre la transició d'un tipus de fulls de càlcul antics en la seva forma física a la electrònica. Teníem un lloc interessant on, ja sabeu, quan els fulls de càlcul eren originalment una cosa que eren només fulls de paper amb files i columnes i que escriuríeu les coses manualment, aleshores, podríeu emplenar-les i calcular-les, ja sigui fent-ho. és a la part superior del cap o amb algun altre dispositiu. Però encara tenim l’oportunitat d’evitar que els errors s’equivoquin amb errors d’escriptura o dislèxia, i ara l’hem substituït per escriptures. El risc és que amb els fulls de càlcul el perfil de risc sigui més ràpid i més gran, però crec que eines com Statistica inverteixen la piràmide de risc.
Sovint dibuixo aquest dibuix en una pissarra d’una figura de pal d’ésser humà a la part superior, com a persona, i després una col·lecció d’ells a la part inferior, diguem-ne, imagino deu d’ells a la part inferior d’aquella pissarra, i dibuixo una piràmide on el punt de la piràmide està a la persona sola i el peu de la piràmide és la col·lecció de persones. I ho faig per visualitzar la idea que si una persona a la part superior fa un full de càlcul equivoca i la comparteix amb deu persones, i ara tenim deu còpies de l’error. Tingueu molta precaució amb les vostres macros i sigueu molt curosos amb Visual Basic si aneu a això. Perquè quan construïm eines electròniques com els fulls de càlcul és molt potent, però també és potent de forma bona i dolenta.
Crec que eines com Statistica permeten invertir aquest perfil de risc, i és que ara podeu arribar al punt en què teniu moltes eines disponibles per a la persona i que van des d’eines a la part superior de la piràmide i després fins a la part inferior en la qual el punt de la piràmide que ara s’inverteix és l’eina real, si tenim un equip de persones que construeixen aquestes eines i aquests algoritmes. I el científic de dades no ha de ser un especialista en analítica regressiva de les seves dades. Pot ser que puguin utilitzar l'eina, però és possible que tingueu cinc o sis estadístics i un actuari i un científic de dades i alguns matemàtics que treballin en aquesta eina, aquell mòdul, aquell algorisme, aquell complement i així en el full de càlcul, de manera que imagineu-vos que tots els fulls de càlcul publicats que podríeu utilitzar eren realment escrits per especialistes que van provar les macros, van provar Visual Basic, es van assegurar que els algorismes funcionessin, així que quan el teníeu, podríeu incloure-hi dades, però en realitat no podríeu esborrar i per tant ha estat millor controlar.
Crec que moltes de les eines d’analítica ho fan. Suposo que, per això, veieu que ara en el camp, esteu veient la transició de fulls de càlcul que potencialment podrien empènyer errors i errors i risc, fins al punt en què aparegueu les eines que creeu amb el vostre plataformes ara, amb la descoberta de dades en temps real i la gent que està construint els mòduls i algorismes elimina o redueix aquest perfil de risc? El servei al client ho veu realment o creieu que això està passant i no se n’adonen?
David Sweenor: Ja ho sabeu, crec que hi ha dues maneres de respondre. Però el que estem veient és, ja ho sabeu, en qualsevol organització i he esmentat que les analítiques crec que potser han quedat des de la perspectiva d’inversions corporatives, tipus del que vam fer amb el magatzem de dades i el CRM. Però el que estem veient, per tant, triga molt a canviar d’organització per superar aquesta inèrcia organitzativa. Però el que estem veient és que la gent pren els seus fulls de càlcul, que prenen els seus fluxos de treball i vaig esmentar la seguretat i el govern: "Bé, potser tinc un full de càlcul", "Bé, puc bloquejar-ho i puc controlar-ne la versió". I veiem moltes organitzacions, potser només comencen allà. I si es canvia, hi ha un flux de treball i acabo, encara que sigui el número u, qui el va canviar? Per què ho van canviar. Quan el van canviar. I també puc configurar un flux de treball de manera que no posaré a la producció aquest nou full de càlcul a menys que sigui validat i verificat per una, dues, tres, tanmateix tantes parts que vulgueu definir al vostre flux de treball. Crec que les persones comencen a fer-se i que les organitzacions comencen a fer passos per allà, però probablement suggeriria que tinguem un llarg camí per recórrer.
Dez Blanchfield: De fet, i crec que, tenint en compte tant els controls de seguretat com la governança que hi ha, llavors la càrrega de treball pot fer una correcció automàtica de tot això fins al màxim responsable de risc, que ara és una cosa. Podeu començar a controlar com s’accedeix a aquestes eines i sistemes i qui fa el que passa amb ells, de manera que és molt potent. Crec que les altres coses que es plantegen és que els tipus d’eines que proporcioneu, per a mi, presten un comportament humà més que als fulls de càlcul tradicionals que estem parlant, ja que si tinc una habitació plena de gent. amb el mateix quadre de comandament i accés a les mateixes dades que poden obtenir una visió diferent i, per tant, obtenir informació lleugerament diferent de la mateixa informació, que s’adapti a les seves necessitats perquè puguin col·laborar. A continuació, tenim una visió i una interacció més humanes amb el negoci i el procés de presa de decisions, en contraposició a tots els que varem anar a la mateixa reunió amb el mateix PowerPoint i les mateixes fulls de càlcul impreses, totes les mateixes dades fixes.
Veieu una transició en el comportament i la cultura a les organitzacions que ara adopten les vostres eines on veuen que es produeix, on no és com cinc persones a la sala mirant el mateix full de càlcul intentant simplement verbalitzar-lo i fer-hi notes., però ara estan interactuant amb els taulers i les eines en temps real, amb visualització i analítica al seu abast i obtenint un flux completament diferent en la conversa i la interacció, no només a les reunions, sinó només a la col·laboració general al voltant de l'organització? Perquè poden fer-ho en temps real, perquè poden fer les preguntes i obtenir una resposta real. És aquesta una tendència que veieu actualment o encara no ha passat tot?
David Sweenor: No, crec que definitivament s’ha començat per aquest camí i crec que el més interessant és, ja sabeu, si prenem l’exemple de fàbrica, per exemple. Potser algú que posseeixi un sector de procés determinat dins d'aquesta fàbrica vulgui mirar i relacionar-se amb aquestes dades d'una determinada manera. I potser jo, passant per alt tots els processos, potser aquest a la part inferior, potser vull mirar-ho a tot. Crec que el que estem veient és que la gent comença a utilitzar un conjunt comú de visualitzacions o visualitzacions estàndard dins de les seves organitzacions, però també s'adapta al paper en què participen. Si sóc enginyer de processos, potser aquesta és una visió molt diferent de la que algú la mira des d'una perspectiva de la cadena de subministrament i crec que és excel·lent perquè s'ha de personalitzar i s'ha de mirar a través de les lents que necessiteu per aconseguir la vostra feina.
Dez Blanchfield: Suposo que el procés de decisions es redueix, amb temps i amb rapidesa, per prendre decisions intel·ligents i precises augmenta ràpidament, no? Perquè si teniu anàlisis en temps real, taulers de comandament en temps real, si teniu les eines Statistica a l’abast de la vostra mà, no heu de passar pel pis per anar a preguntar alguna cosa a algú, ja ho teniu. en versió impresa. Podeu col·laborar, interactuar i prendre decisions sobre la marxa i obtenir aquest resultat immediatament. Cosa que crec que algunes de les empreses encara no han entès, però, quan ho facin, serà aquest moment eureka que, sí, encara podem romandre als nostres cubells i treballar a casa, però podem interactuar i col·laborar i aquestes decisions. fem que mentre col·laborem es converteixin en resultats a l’instant. Mira, crec que ha estat fantàstic escoltar el que has de dir fins ara i tinc moltes ganes de veure cap a on va. I sé que tenim moltes preguntes en Q&A, així que em dirigiré a Rebecca per passar per algunes de les que puguem arribar a les més ràpides que puguis. Moltes gràcies.
Rebecca Jozwiak: Gràcies Dez i sí, Dave, tenim moltes preguntes del públic. I gràcies a Dez i Robin també per la vostra informació. Sé que aquest participant va haver de deixar-se directament al capdamunt de l’hora, però ella és una mica preguntant, veieu que els departaments de sistemes d’informació donen més prioritat als controls de dades sofisticats que no pas a la comoditat de proporcionar eines per els treballadors del coneixement? Vull dir, és això, endavant.
David Sweenor: Sí, crec que depèn de l’organització. Crec que un banc, una companyia d’assegurances, potser tenen prioritats i maneres de fer diferents, enfront d’una organització de màrqueting. Suposo que hauria de dir que només depèn de la indústria i de la funció que busqueu. Les diferents indústries tenen un enfocament i un enfocament diferents.
Rebecca Jozwiak: Està bé, això té sentit. I un altre assistent va voler saber, quin és el motor que hi ha darrere de Statistica? És C ++ o coses pròpies?
David Sweenor: Bé, no sé si puc obtenir aquesta informació concreta, ja que ha estat al voltant de 30 anys i es va desenvolupar abans del meu temps, però hi ha una biblioteca central d'algorismes analítics que són els algorismes estatístics que funcionen. I veieu aquí que també podem executar R, podem executar Python, podem explotar a Azure, podem funcionar a Spark a H2O, així que suposo que hauria de respondre aquesta pregunta en termes de varietat de motors. I depenent de quin algorisme trieu, si és un de Statistica, aquest funciona, si en trieu un a H2O i Spark, en fa servir, i per tant, en són diversos.
Rebecca Jozwiak: Està bé. Un altre tipus d’assistent va preguntar a apuntar específicament a aquesta diapositiva, volent saber, com és, com sap el científic de dades ciutadanes quines plantilles reutilitzables utilitzar? I suposo que tindré una qüestió més àmplia. Això, què esteu veient quan hi entren usuaris i analistes de negoci que volen fer servir aquestes eines, com de fàcil és agafar-los i sortir a funcionar?
David Sweenor: Suposo que respondria i si podeu utilitzar, si coneixeu Windows, es tracta d’una plataforma basada en Windows, així que he tallat la part superior d’aquestes captures de pantalla, però té la cinta de Windows. Però, com saben quin flux de treball utilitzar? Sembla l'Explorador de Windows, de manera que hi ha una estructura d'arbre i podeu configurar-la i configurar-la, però la vostra organització vol configurar-la. Però pot ser, només tindríeu aquestes carpetes i introduiríeu aquestes plantilles reutilitzables en aquestes carpetes. I crec que probablement hi hagi una nomenclatura que la seva empresa pugui adoptar, digueu aquí el "càlcul de perfil de risc", aquí hi ha "obteniu dades d'aquestes fonts" i els poseu el nom que vulgueu. És només una carpeta gratuïta, només arrossegueu les notes cap a la pantalla al vostre llenç. Així, bastant fàcil.
Rebecca Jozwiak: Està bé. Potser una demostració la propera vegada. Aleshores apareix un altre tipus de participants i és del que parlàveu tu i Robin i Dez pel que fa a les inexactituds, sobretot en un full de càlcul, però les escombraries que hi ha a dins i a les escombraries, i veu que són encara més crítics quan es tracta a l’analítica. Sabia esmentar que, un ús indegut de les dades, pot causar algunes decisions desafortunades. I es pregunta quins són els vostres punts de vista sobre el desenvolupament d'algorismes amb més problemes de seguretat, suposo que, per a, utilitza la paraula "excessiu" d'analítica. Ja sabeu, algú entra, s’entusiasma molt, vol fer aquestes analítiques avançades, vol executar aquests algoritmes avançats, però potser no estan del tot segurs. Què feu, per tal de protegir-vos d’això?
David Sweenor: Yeah, so I guess I'll answer this as best I can, but I think everything comes down to people, process and technology. We have technology that helps enable people and helps enable whatever process you want to put in within your organization. In the example of sending a coupon to somebody, maybe that's not as critical, and if it's digital it's really no cost, maybe there's one level of security controls and maybe we don't care. If I am predicting surgical site infections, maybe I want to be a little more careful about that. Or if I am predicting drug quality and safety and things like that, maybe I want to be a little more careful about that. You're right, garbage in/garbage out, so what we try to do is provide a platform that allows you to tailor it to whatever process your organization wants to adopt.
Rebecca Jozwiak: Okay good. I do have a few more questions, but I know we've gone quite a bit past the hour and I just want to tell our presenters, that was awesome. And we want to thank so much Dave Sweenor from Dell Statistica. Of course, Dr. Robin Bloor and Dez Blanchfield, thank you for being the analysts today. We are going to have another webcast next month with Dell Statistica. I know Dave kind of hinted about the topic. It will be about analytics at the edge, another fascinating topic, and I know that some very compelling use cases are going to be discussed on that webcast. If you liked what you saw today, come back for more next month. And with that, folks, I bid you farewell. Thanks so much. Adeu.