Casa Bases de dades Impuls endavant: avançant relacionalment més enllà del tradicional

Impuls endavant: avançant relacionalment més enllà del tradicional

Anonim

Per Techopedia Staff, 8 de juny de 2016

Take away: L' amfitrió Eric Kavanaugh discuteix les novetats en la tecnologia de bases de dades amb els experts Dez Blanchfield, Robin Bloor i Bert Scalzo.

Actualment no teniu la sessió iniciada. Inicieu la sessió o registreu-vos per veure el vídeo.

Eric Kavanagh: Senyores i senyors, és dimecres, a les quatre de l'est. Estic a Nova Orleans, l’estiu s’acosta, això vol dir que fa calor. És el moment de Hot Technologies, sí, de fet, sí. Em dic Eric Kavanagh, seré el vostre amfitrió. Vaig a xutar la pilota aquí per Hot Technologies. El tema actual és "Endavant moment: moure relacionalment més enllà del tradicional". Persones actuals, tenim tres experts en bases de dades al telèfon, de manera que qualsevol pregunta que tingueu, envieu-los els més difícils, no sigueu tímids. Avui us oferim un munt de bons continguts. Hi ha un lloc sobre el vostre veritablement, prou sobre mi. Per descomptat, aquest any fa calor. Parlem de tecnologies calentes en aquest saló, que és una col·laboració amb els nostres amics de Techopedia. Tot seguit, anem fins al fonament de la gestió de la informació que avui és la base de dades. Parlarem de com hem arribat fins aquí, del que passa avui i del que passa. Hi ha moltes coses molt interessants.

Evidentment, tenim una seriosa innovació en l’espai de bases de dades. Va estar una estona tranquil·la; si parleu amb alguns analistes del negoci, diria que probablement des de l'any com el 2005 fins al 2009 o el '10 'no semblava que passés massa quant a la innovació. I, de sobte, tot va esclatar, com un jailbreak o alguna cosa així, i ara hi ha tot tipus de coses interessants. Molt d’això es deu a l’escala de la web i a totes les excel·lents propietats web que fan diferents coses interessants. D’aquí va sorgir el concepte NoSQL. I això vol dir dues coses diferents: vol dir que no hi ha SQL, ja que no és compatible amb SQL, sinó que no només és SQL. Hi ha un terme "NewSQL" que han utilitzat algunes persones. Però, òbviament, el de SQL (el llenguatge de consulta estructurada) és realment el fonament, és la base de la consulta.

I és interessant que tots aquests motors NoSQL, què va passar? Bé, van sortir, hi havia molta il·lusió, i uns quants anys després, què vam començar a sentir? Oh, SQL a Hadoop. Bé, totes aquestes empreses van començar a xapar les interfícies SQL a les seves eines NoSQL, i qualsevol que estigui al món de la programació sap que això comportarà alguns reptes i algunes dificultats, i alguns cables creuats, etc. Així que avui descobrirem moltes coses sobre aquestes coses.

Hi ha els tres presentadors: tenim a Dez Blanchfield una trucada a Sydney, el nostre propi Robin Bloor, que és a Texas, i també Bert Scalzo, també és a Texas. Aleshores, primer de tot, escoltarem a Dez Blanchfield. Persones populars, anirem a tuitejar al hashtag de #HotTech, així que no dubteu a enviar els vostres comentaris o enviar les vostres preguntes a través del component de Q&A de la consola de transmissió web o fins i tot a través de la finestra de xat. I amb això, Dez Blanchfield, treu-ho.

Dez Blanchfield: Gràcies, Eric. Hola a tothom. Així doncs, vaig a intentar fixar l'escena en un punt de vista de 30.000 peus de tipus d'allò que ha passat en l'última dècada i els canvis importants que hem vist, o almenys una dècada i mitja, de totes maneres. els sistemes de gestió de bases de dades i alguns dels impactes des del punt de vista comercial o tècnic i algunes de les tendències que hem suportat fins a finalitats i ens condueixen a la conversa que hem de tenir avui al voltant del tema.

La meva imatge de portada aquí és una duna de sorra i hi ha un vent que bufa petites parts de sorra a la part superior d'ella. Com a resultat d'això, el que passa és que la duna de sorra camina lentament d'un espai a un altre. I és un fenomen sorprenent, on aquestes masses muntanyes de sorra de 40 i 50 peus d'altura, efectivament, es mouen. I es mouen molt lentament, però es mouen segurament i, a mesura que es mouen, canvien el paisatge. I és una cosa que cal mirar si es passa algun moment en una zona on les dunes són una cosa natural. Perquè un dia podeu mirar per la finestra i adonar-vos que aquesta muntanya massiva de sorra, petits grans petits s’han mogut tot sol, en efecte, i que el vent la mou lentament d’un lloc a l’altre.

I crec que de moltes maneres, aquest és el món dels sistemes de bases de dades des de fa temps. Fins fa molt, molt recentment, aquell canvi molt reduït en forma de grans de sorra desplaçava una muntanya gegant de sorra en forma de duna de sorra. Al llarg dels anys s’han produït pocs canvis en les plataformes de bases de dades, i ha estat un entorn prou estable i sòlid al voltant dels sistemes i plataformes de bases de dades, a través del fotograma de l’era de gamma mitjana. Però, fins al final, hem passat algunes coses força significatives a les nostres necessitats comercials i als nostres conductors tècnics. Va a passejar-nos per aquestes.

Tinc la visió que el concepte bàsic d’una base de dades, tal i com el coneixíem durant molts, molts anys i, com heu pogut escoltar en el banter pre-show, els nostres dos experts que avui estan a la trucada van tenir tota la vida aquest espai i tenen tota la raó de compartir els drets de presumptesa d’estar-hi quan tot va començar a principis dels anys 80. Però hem vist aquest canvi massiu durant l’última dècada i una mica, i vaig a recórrer-nos ràpidament abans de lliurar-lo al doctor Robin Bloor.

Hem passat per això el que anomeno "experiència més gran, millor, més ràpida, més barata". Com he dit, la definició d’una base de dades ha canviat. El paisatge en què les plataformes de bases de dades han hagut de fer front al rendiment i els requisits tècnics i comercials també s’han canviat. Hem augmentat la demanda de solucions per fer front a requisits comercials més complexos o tècnics més complexos. I, per tant, una mirada realment ràpida a través del que això significa realment, al meu cap, és que vam arribar a fer una classe dels anys 90, i vam veure que la tecnologia de bases de dades va tenir un impacte amb la introducció d’Internet i una mena de com vam anomenar llavors Internet escala. No parlàvem només de gent que es trobava davant dels terminals, al principi els agraden els terminals de teletipar amb impressores físiques incorporades i 132 columnes de text que apareixen en paper. A continuació, els primers terminals de la pantalla verda, perforant amb els teclats

Però ja sabeu, el nostre món era terminals i cables en sèrie o en xarxa parlant amb ordinadors durant molt de temps. Aleshores va arribar internet, i aquest explosiu creixement de connectivitat, que ja no havíeu d’estar connectat a l’ordinador. Per arribar a un sistema de bases de dades només necessitava un navegador web. De manera que la tecnologia de bases de dades va haver de canviar dràsticament, per fer front a l’escala de tot, des de les tecnologies bàsiques dels motors de cerca que s’utilitzaven per indexar el món i emmagatzemar un índex d’informació, com a exemple de l’escala de format de base de dades. I gent com Google i altres van proporcionar una plataforma per fer-ho. I es van produir tots els nous tipus d’emmagatzematge de bases de dades, la consulta i la indexació. Després vam tenir llocs de música i llocs de pel·lícules.

A la dècada de 2000, vam veure el boom punt-com, i això va produir una explosió encara més dramàtica en el nombre de persones que utilitzaven sistemes que eren alimentats invariablement per una base de dades d'alguna forma. En aquesta fase, les bases de dades relacionals encara cobrien la major part de la càrrega, simplement les vam posar en un estany més gran i vam passar als sistemes de gamma mitjana molt, molt grans, que utilitzen plataformes Unix de persones com IBM i Sun, etc. . El boom dot-com simplement va fer que les coses fossin més grans i més ràpides des del punt de vista del maquinari, i hi va haver alguns canvis importants en els motors de la base de dades, però, per a la millor, encara era el mateix que teníem vist per a una llarg temps.

I aleshores vam aconseguir aquesta era de la web 2.0, com ens referim. Aquest va ser un canvi monstruós, perquè de sobte necessitàvem plataformes de bases de dades molt més senzilles, i hi havia d’haver una escala a una forma horitzontal. I això va suposar un canvi tan important en la manera que ens vam apropar a la idea del que era una base de dades. Segons el meu parer, seguim sent molt interessats. I ara tractem tot aquest quagmire, i dic que amb un gir positiu, no amb una connotació negativa, aquest quagmire del que fem referència a big data i una enorme explosió, i vull dir explosió. Aquest desplaçament indignant és vertical del gràfic del nombre d’opcions que tenim quan parlem d’una base de dades i d’alguna forma de capacitat de consulta relacional.

I, interessantment, sóc personalment del parer que crec que les dades grans són només la punta de l’iceberg. Tenim la il·lusió una mica de l’impacte de les grans dades i dels tipus d’opcions que tenim disponibles ara. Tenim tot de motors NoSQL, tenim motors gràfics, disposem de tots aquests diferents tipus de plataformes per les quals podem llençar dades i fer coses. Fins i tot fins al punt que, de fet, una de les primeres converses que vaig mantenir amb Eric Kavanagh, que avui està aquí amb nosaltres, va tenir entorn d'una conversa relacionada amb una cosa anomenada Apache Drill, que és un projecte de codi obert que permet consultar. les dades del model de diferents tipus de dades: tot, des de fitxers CSE en brut que es troben en un disc dur, passant per sistemes de fitxers HDFS a escala de petabyte. I ja ho sabeu, us permet fer aquestes consultes a l'estil SQL de dades estructurades i no estructurades de tot tipus de plantes emocionants.

Estem a punt de veure que "edifici intel·ligent" es converteix en una cosa i ens agradaria pensar que tenim edificis intel·ligents de seguretat i gestió de calor, però estic parlant d'edificis intel·ligents que saben molt més sobre qui ets i on esteu quan entreu i feu tot tipus de coses netes a aquest nivell, passant per ciutats intel·ligents (ecosistemes sencers a nivell de ciutat) que sàpiguen fer les coses de manera intel·ligent. I més enllà d’això, hem aconseguit aquesta cosa increïble que no crec que ningú del món estigui completament assolit, i que és la forma d’Internet de les coses. Hi ha hagut tots aquests canvis diferents durant la darrera dècada i, potser, dues dècades, aproximadament, si ho completem, han afectat al món allò que considerem bases de dades.

Hi ha hagut un parell de coses significatives que han fet possible això. El cost dels discs durs s’ha reduït de forma espectacular i, en molts aspectes, és el que ha permès conduir algunes de les arquitectures de referència com el model Hadoop, ja que agafem moltes dades i les difonem en molts discs durs i fer coses intel·ligents amb ell. I, de fet, el que es va aguditzar, segons el meu parer, de la base de dades relacional o del model tradicional d’unitat de DB. I la RAM va obtenir molt, molt barat, i això ens va oferir una oportunitat totalment nova per jugar amb diferents arquitectures de referència com ara la memòria, i fer coses com ara particionar un volum molt gran de dades.

De manera que això ens va donar aquesta petita imatge que estem veient ara, que és un diagrama que mostra els tipus de plataformes disponibles si esteu dins del panorama de dades grans. I és molt, molt difícil de llegir i, per això, hi ha massa informació al respecte. Hi ha moltes opcions de fer, modelar i fabricar formes de posar dades en sistemes de bases de dades de qualsevol forma i consultar-les i fer les tradicionals lectures. I no tots compleixen, de fet, molt pocs fins i tot compleixen qualsevol estàndard d’estil bàsic, però encara es consideren una base de dades. I us mostraré un parell de pantalles en un segon per oferir-vos un context entorn del que vull dir amb el pas dels anys 90 a l'escala d'internet, a la web 2.0 i, tot seguit, a tot el creixement a través de grans dades. Si creiem que aquest gràfic de paisatge de tecnologia de dades grans és excitant perquè hi ha moltes opcions, només fem una ullada a una de les claus verticals.

Mirem la tecnologia de màrqueting. A continuació, es mostren les opcions per als sistemes de gestió de bases de dades o la gestió de dades només dins de l’espai mar-tech, de manera que la tecnologia relacionada amb la comercialització. Ara era el 2011, per tant fa uns anys; fa cinc anys, això era el que semblava el paisatge. Si només torno a fer una diapositiva breument, és el que sembla el panorama actual de dades en les diferents marques i ofertes que tenim en tecnologies de bases de dades. Això és el que semblava vertical fa cinc anys, només en tecnologia de màrqueting.

Ara si passo a la visió actual, això és el que sembla, i és completament impenetrable. És només aquest mur de marques i opcions, i és que milers i milers de combinacions de programari es consideren a la classe de bases de dades, que pot capturar, crear o emmagatzemar i recuperar dades de diverses formes. I crec que ara entrem en un moment molt, molt interessant i valent, on una vegada podríeu conèixer les grans marques, podríeu conèixer les cinc o sis plataformes diferents d'Oracle i Informix, DB2, etc., i ser gairebé un expert en totes les marques disponibles fa uns vint anys. Fa deu anys, es va fer una mica més fàcil perquè algunes de les marques van caure i no totes les marques van poder fer front a la magnitud del boom punt-com, i algunes empreses només es van trencar.

Avui és absolutament impossible ser expert en tota la tecnologia de bases de dades existent, ja sigui en bases de dades relacionals o en plataformes de gestió de bases de dades estàndard que hem conegut durant les últimes dues dècades. O potser el cas, els motors més moderns com Neo4j i d’aquest tipus. Així doncs, crec que estem entrant en un món molt valent, on hi ha moltes opcions disponibles i que tenim plataformes a escala de manera horitzontal, ja sigui a la memòria o al disc. Però crec que és un moment difícil per als responsables de la tecnologia i els negocis, perquè necessiten prendre decisions molt grans sobre piles tecnològiques, que en alguns casos només han estat durant uns mesos essencialment. L'edat de divuit mesos no és una cosa espantosa per a algunes de les plataformes de bases de dades de codi obert més interessants i noves. I comencen a fusionar plataformes i es tornen encara més noves i emocionants.

Crec que avui tindrem una gran conversa sobre com ha afectat tot això a les plataformes tradicionals de bases de dades i com s’hi responen i els tipus de tecnologies que s’estan llançant. I amb això en compte, passaré ara al doctor Robin Bloor, i faré conèixer els seus coneixements. Robin, a sobre.

Robin Bloor: D'acord, gràcies per això. Sí, aquest és un tema massa gran. Vull dir, si només prengueu una tirada d’una de les il·lustracions que Dez acabava mostrant, podríeu mantenir una conversa llarga sobre una de les fulles. Però ja sabeu, podeu anar a una base de dades. He estat buscant bases de dades, no ho sé des de la dècada de 1980, i podeu mirar la base de dades de maneres diferents. I una de les coses que pensava que faria, només llançar-me a la conversa avui, era parlar de la raó per la qual han ocorregut coses pertorbadores a nivell de maquinari. I heu de tenir en compte, també han passat moltes coses pertorbadores a nivell de programari, de manera que aquesta no és la imatge completa de res, només és una cosa de maquinari.

Tampoc anava a parlar gaire, només volia donar-vos la imatge del maquinari. Una base de dades eren capacitats de recuperació de dades que abasten la CPU, la memòria i el disc, i això està canviant notablement. I la raó per la qual dic això, és que vaig aprendre a comprendre la base de dades des de la perspectiva del que realment vau fer. Ja sabeu, hi ha una diferència de latència entre les dades realment de la CPU i les dades que es treuen de la memòria a la CPU i les dades que es treuen del disc a la memòria i de la CPU. I les antigues arquitectures de bases de dades només intentaven equilibrar-ho. Ja sabeu, deien: "Bé, això va molt lent, anem a caché les dades del disc perquè quedin a la memòria. Intentarem fer-ho d’una manera realment precisa de manera que una bona part de les dades que sol·licitem ja quedi a la memòria. I marcarem les dades a la CPU tan ràpidament com realment puguem. "

I les bases de dades es van escriure a les antigues màquines s’escriuen per a petits clústers. I ara, per l’ignorant del paral·lelisme. Perquè si obteniu una mica de rendiment d'un clúster, haureu de fer diverses coses en paral·lel. El paral·lelisme és una part del joc, res semblant a la forma actual. Només recorreré el que ha passat.

En primer lloc, el disc. Doncs s’ha acabat el disc, de veritat. Ja s'ha acabat pràcticament pel que fa a les bases de dades. Crec que hi ha diversos contextos per arxivar dades, i fins i tot llacs de dades molt grans que s’executen a Hadoop, el pitjor disc de filar és probablement viable avui dia. El problema del disc girant realment era que les velocitats de lectura no milloraven especialment. I quan la CPU augmentava la velocitat de la llei de Moore, un tipus d’ordre de magnitud, cada sis anys més ràpid. I la memòria va seguir com a conseqüència, llavors aquests dos van seguir raonablement el ritme entre ells, no va ser del tot suau, però sí.

Però la lectura aleatòria a un disc on el cap vola sobre el disc, vull dir que, a part de qualsevol altra cosa, és un moviment físic. I si esteu fent lectures aleatòries d’un disc, és increïblement lent en comparació amb la lectura de la memòria, és com 100.000 vegades més lent. I fa relativament poc, la majoria de les arquitectures de bases de dades que he analitzat en qualsevol profunditat només han estat llegint en sèrie des dels discos. Realment voleu, d’una manera o altra, emmagatzemar la memòria cau del màxim possible del disc i traure’l del dispositiu lent i posar-lo a un dispositiu ràpid. I hi ha moltes coses intel·ligents que es poden fer amb això, però ja s’ha acabat.

I els discos d’estat sòlid, o unitats flash, realment, és el que són, substitueixen molt ràpidament el disc de filatura. I això torna a canviar completament, perquè la forma d’organitzar les dades en un disc està organitzada segons la forma de funcionament del disc. Es tracta, en realitat, d’un cap que es mou a través d’una superfície de filar, en realitat de diversos caps que es mouen per diverses superfícies de filar i de recollir les dades a mesura que passen. Una unitat d’estat sòlid és només un bloc de coses que podeu llegir. Vull dir, el primer és que totes les bases de dades tradicionals han estat dissenyades per a filar disc, i ara s’estan dissenyant per a SSD. Probablement les noves bases de dades poden ser probables: qualsevol persona que estigui escrivint una nova base de dades pot probablement ignorar el disc girant, no pensar-ho en absolut. Però Samsung, el principal fabricant de discs SSD, ens diu que els SSD estan realment en la corba de llei de Moore.

Ja crec, unes tres o quatre vegades més ràpides que el disc girant, però ara seran molt més ràpides cada 18 mesos, bàsicament. El doble de velocitat i la velocitat de deu vegades fins a uns sis anys. Però, però, no ho és, tal i com us ho explicaré en un moment. El disc de filatura, per descomptat, s'està convertint en un mitjà d'arxiu.

Quant a la memòria. Primeres coses primer, RAM. La relació de CPU entre RAM per CPU acaba d’augmentar tot el temps. I, per descomptat, en certa manera, aporta molta més velocitat, perquè les memòries que es poden tenir ara poden emmagatzemar molt més. En realitat això és que redueix la pressió sobre les aplicacions MLTP o les aplicacions de lectura aleatòria, perquè és més fàcil atendre-les, ja que ara teniu molta memòria i, d'aquesta manera, podeu fer memòria cau qualsevol cosa. és probable que es pugui llegir a la memòria. Però teniu problemes amb un munt de dades més gran, de manera que les dades grans en realitat no són tan senzilles.

I després tenim Intel amb 3D Xpoint, i IBM amb el que anomenen PCM, que és memòria de canvi de fase, estan oferint una cosa que creuen que és, bé, és almenys 10 vegades més ràpida que els SSD actuals, i creuen que obtindrà. molt a prop de tenir la mateixa velocitat que la RAM. I, per descomptat, és menys costós. Abans, teníeu aquesta estructura de base de dades de CPU, memòria i disc, i ara ens dirigim cap a una estructura que té quatre capes. Té CPU, memòria o RAM, i després aquest tipus de memòria més ràpida que SSD, que no és volàtil, i després SSD. I aquestes noves tecnologies no són volàtils.

I hi ha el memristor d’HP, que no ho és encara, ja ho sabeu, perquè es va anunciar fa uns set anys, però encara no apareix. Però els rumors que escolto és que HP també canviarà el joc una mica amb un memristor, de manera que només teniu una nova situació de memòria. No és com si tinguéssim coses més ràpides, com si tinguéssim una capa completament nova. I després hem aconseguit que l’accés SSD, el podeu llegir en paral·lel. No podeu llegir disc de filatura en paral·lel, tret que tingueu molts discs giratoris diferents. Però, un bloc de disc SSD, es pot llegir en paral·lel. I perquè podeu llegir-ho en paral·lel, va molt més ràpid que les seves velocitats de lectura senzilles, si realment configureu diversos processos a través dels diversos processos d’una sola CPU i només teniu amb SSD.

S’estima que podeu aconseguir gairebé velocitats de RAM. I tot el que està dient, el futur de l’arquitectura de la memòria no està clar. Vull dir, la realitat és que els diferents venedors dominants, que siguin els que siguin, probablement determinaran la direcció del maquinari. Però ningú sap cap a on arriba aquest moment. He parlat amb alguns enginyers de bases de dades que diuen: "No tinc por del que passi", però no saben com optimitzar-lo a partir del primer moment. I sempre ho heu fet, així que és interessant.

I després hi ha la CPU. Bé, les CPU multicore no eren només CPU multicor. També tenim volums significatius de memòria cau L1, L2 i L3, en particular L3, que és fins a, no sé, desenes de megabytes. Podeu posar-hi molt, ja ho sabeu. I, per tant, realment podeu utilitzar el xip com a mitjà d’emmagatzematge en memòria cau. Així que això va canviar el joc. I, certament, el processament de vector i la compressió de dades, diversos proveïdors ho han fet realment, arrosseguen aquestes coses a la CPU per fer que tot vagi molt més ràpid a la CPU. A continuació, s'obté el fet que, bé, les CPU amb GPU són molt bones per accelerar les analítiques. I realment són molt bones en determinats tipus de consultes, només depèn de quina sigui la vostra consulta.

Podeu crear taulers amb CPUs i GPUs o, com fa AMD en aquest moment, produiu una cosa anomenada APU, que és una mena de matrimoni entre una CPU i una GPU; Hi ha dos tipus de capacitat. Així doncs, aquest és un tipus de processador diferent. I el recent anunci d’Intel que anirà a posar un FPGA al xip, aquest tipus de cap em va entrar. Vaig pensar: "Com va a succeir?" Perquè si teniu la possibilitat de CPU, GPU i teniu la possibilitat de CPU, FPGA, i, per cert, si voleu, al mateix tauler podríeu posar una CPU, una GPU i una FPGA. No tinc ni idea de com realitzaria qualsevol cosa d'aquesta manera, però sé que són empreses que estan fent coses així, i obtenen respostes de consulta molt ràpides. Això no és una cosa que s'ha d'ignorar, això és quelcom que utilitzaran els venedors establerts i, potser, els venedors nous. Els SGBD sempre eren paral·lels, però ara les possibilitats paral·leles acaben de explotar, perquè això permet paral·lelitzar-ho amb això, amb això, amb això de diverses maneres.

Finalment, per ampliar o ampliar? Realment augmentar és la millor solució, però per a una cosa. Obteniu un rendiment molt millor del node si només podeu optimitzar absolutament el rendiment de la CPU i la memòria del disc en un mateix node. I fareu servir menys nodes, així que serà més barat, oi? I serà més fàcil de gestionar. Malauradament, és un disseny que depèn del maquinari i, a mesura que el maquinari canvia, és cada vegada menys possible fer-ho, tret que els vostres enginyers puguin funcionar tan ràpidament a mesura que el maquinari canviï. I obteniu problemes de càrrega de treball, ja que quan esteu augmentant, feu diversos supòsits sobre el que farà la càrrega de treball.

Si realitzes una escala, és a dir, si la teva arquitectura posa èmfasi en una escala abans que es faci una escala, de fet, has de fer-los tots dos, només cal destacar-ne un. Aleshores, obtindreu un millor rendiment de xarxa, perquè l'arquitectura s'ocuparà. Serà més car en termes de maquinari perquè hi haurà més nodes, però hi haurà menys problemes de càrrega de treball i hi haurà un disseny més flexible.

I només pensava que ho llençaria, perquè, si realment penses en tots els canvis de maquinari, només vaig apuntar el dit i, després, hi penses, com vas a ampliar i ampliar aquestes coses? Aleshores, t’adones que els enginyers de bases de dades són, al meu parer, com a mínim, ben remunerats. Per tant, si només contempleu la capa de maquinari, els reptes de la base de dades són clars. Ara li transmeto a Bert, que ens farà educar a tots.

Eric Kavanagh: Ja està! Bert?

Bert Scalzo: Moltes gràcies. Permetin-me entrar directament en aquestes diapositives. Tinc moltes diapositives per recórrer, així que en puc algunes de les que puc passar més aviat. Parlarem d’aquest “Moment endavant: anar relacional més enllà del tradicional”. Ja no és la base de dades del vostre pare. Les coses han canviat i, com va dir un orador anterior, els darrers sis a set anys, el paisatge ha canviat radicalment.

Jo mateix, faig bases de dades des de mitjan anys vuitanta. He escrit llibres sobre Oracle, SQL Server, comparatives i moltes altres coses. “El món està canviant molt ràpidament. El gran ja no bategarà als petits. Serà el ràpid batre el lent ”. Vaig afegir“ per adaptar-nos ”. Això era de Rupert Murdoch. Realment crec que això serà cert. No podreu fer coses de bases de dades tal i com ho vau fer fa 10, 15, 20 anys enrere. Haureu de fer-ho tal com el negoci ho desitgi ara.

Intentaré mantenir una mica genèric en allò que us presento, però la majoria de les funcions de què parlo les trobareu a Oracle, les trobareu a SQL Server, MySQL, MariaDB i algunes de les altres grans jugadors. La revolució relacional de bases de dades, estic d'acord amb els altaveus anteriors. Si us veieu bé al voltant del 2010, passàvem del cotxe de la cursa vermella al cotxe groc. Hi ha hagut un canvi significatiu i, a partir del 2020, crec que veureu un altre canvi radical. Estem en un moment molt interessant.

Ara, aquesta diapositiva és clau, és per això que hi poso una clau. Hi ha tot aquest canvi, i a la part esquerra tinc tecnologia i, a la banda dreta, tinc negocis. I la pregunta és, quina causa la qual, i quina suporta? Tenim tots aquests canvis de maquinari: discs baixant, mida de disc a la pujada, nous tipus de discos, de manera que quedaven coberts pels altaveus anteriors. El preu de la memòria caient, totes aquestes versions més recents de bases de dades. Però, a la part dreta, tenim protecció i compliment de dades, magatzem de dades, intel·ligència empresarial, analítica, retenció de dades obligatòria. Les dues cares de l’equació es dirigeixen i les dues cares de l’equació faran ús de totes aquestes novetats.

En primer lloc, tenim el nostre disc de filatura SAS típic, ara tenen fins a 10 terabytes. Si no ho heu vist, Western Digital, HGST té el que anomenen unitat d’heli, que puja a uns 10 terabytes en aquest moment. Els costos del disc de filatura són força baixos. Com s'ha comentat anteriorment, podeu obtenir discs d'estat sòlid fins a uns dos terabytes, però Samsung tindrà una unitat de 20 terabytes properament. Els costos són cada cop més raonables. Una cosa que parlaré dels altres no ho és, el concepte de discos flash. PCIe, que és PCI Express, versus NVMe, potser haureu o no sentit parlar d'aquesta memòria no volàtil express. Bàsicament, NVMe serà un reemplaçament de SAS i SATA, i és realment un protocol de comunicació més que qualsevol altra cosa. Però aquests discos són de fins a tres terabytes ara.

També és possible que algunes unitats SAS tinguin ara connectors U.2, que és una mena de connector diferent que un SAS o SATA, que suporta NVMe amb un disc estàndard; el disc també ho ha de suportar. A continuació, SATA amb connectors M.2, i aquests comencen a obtenir NVMe. De fet, hi ha venedors de quaderns que ara venen quaderns que tenen un disc flash NVMe, i aquestes coses cridaran en comparació amb la tecnologia que heu utilitzat abans.

Molta gent no sap quins són aquests diferents flaixos. Si mireu a la cantonada inferior dreta, aquest és un exemple de M.2. Potser dius: “Bé, gee, s’assembla molt a la unitat de mSATA a l’esquerra.” Però, com es pot veure, té dues llacunes en els pins que no pas una i és una mica més gran. I, a més, el M.2 pot arribar a tenir tres mides diferents.

A continuació, el flaix PCI Express i el flaix NVMe. Ara, el flash NVMe també és PCI Express, però PCI Express és encara un algorisme de controlador tipus SAS o SATA escrit per a disc de filatura, i NVMe són els algorismes o tècniques que es van escriure específicament per a flaix. I de nou, anireu veient tots aquests.

NVMe ofereix moltes coses. Crec que les dues millores més importants són que, a la part superior dreta, la latència es redueix fins a un 70 per cent. De fet, he vist fins i tot més gran que això. A més, si mireu a la cantonada inferior dreta, quan el vostre sistema operatiu parla amb el disc NVMe, passa per molt menys nivells de programari. Bàsicament, aneu a través del controlador NVMe que s’inclou ara amb el sistema operatiu i parla directament amb els mitjans de comunicació. Hi ha moltes raons per les quals aquesta tecnologia canviarà radicalment el món de la base de dades.

I moltes vegades, la gent dirà: "Bé, què tan ràpid és NVMe?" Ja ho sabeu, els bons vells temps, al 2004 i abans, ens emocionàvem si teníem Ultra-320 SCSI, 300 megabytes per segon. Les velocitats actuals, molts de vosaltres probablement sou en fibra o en InfiniBand, i en aquest tipus de resultats. NVMe allà a la dreta, comença per on acaben les tecnologies actuals. El que tinc és, PCI Express 3.0 amb un enllaç de vuit carrils comença a gairebé 8000, i anirà augmentant a mesura que obtenim versions més noves de PCI Express, versions quatre i així successivament. NVMe no té lloc enlloc, excepte cap amunt.

Ara, quines coses canvien a la base de dades? Ara a les cantonades de la part superior dreta de les meves diapositives, poso els motius empresarials que crec que apareixia la tecnologia. En aquest cas, a causa del magatzem de dades i per motius normatius de retenció obligatòria de les dades, les bases de dades comencen a oferir compressió. Ara, algunes bases de dades ofereixen compressió com a complement, d'altres ho ofereixen com a integrat a l'estàndard, diguem que l'edició empresarial de la seva base de dades, i, tanmateix, algunes bases de dades, com a Oracle, podrien incloure una versió encara millor de compressió. per exemple, a la seva plataforma Exadata, de manera que realment han creat un maquinari que pot suportar una compressió molt especialitzada i que a Exadata, per exemple, obté una velocitat de compressió de 40x, i per tant és molt significatiu. I crec que és la retenció de dades obligatòria, la gent només vol que sigui més llarga. Les empreses, per fer anàlisis i BI, necessiten els darrers 5, 10, 15 anys de dades.

Ara una altra característica que va començar a aparèixer al voltant d'aquest període de 2008 es va dividir. Un cop més, ho trobareu en bases de dades com Oracle, SQL Server i en les dues que heu de pagar. A Oracle heu de comprar l’opció de particions i a SQL Server heu d’estar a l’edició del centre de dades. És la vostra tècnica tradicional de separar i conquistar. El que fas és tenir el concepte d'una taula gran lògica a la part superior i, quan es posa en disc, en realitat es descompon en cubetes. I podeu veure que aquests cubells estan organitzats per uns criteris per separar, normalment referits o anomenats funció de particions i, de la mateixa manera, també podeu sub-particionar-se en algunes plataformes de bases de dades i podeu anar encara més enllà.

De nou, crec que tant l’emmagatzematge de dades com la retenció obligatòria de dades l’han impulsat, i en algunes d’aquestes bases de dades podeu tenir fins a 64.000 particions, i crec que en algunes altres bases de dades fins i tot fins a 64.000 subparticions. Això permet desglossar les vostres dades en peces manejables. També particionareu els índexs; és una opció, no cal, però també podeu repartir els índexs. Una de les raons per fer-ho pot ser que teniu una finestra corredissa de dades. Voleu conservar dades de 10 anys, però per deixar anar els índexs a la càrrega de lots d’aquesta nit, no heu de deixar caure els índexs a cada fila, només a les files que hi ha a la cubeta actual. El particionar és en realitat una molt bona eina administrativa, tot i que la majoria de la gent creu que el seu gran benefici és suposar l'eliminació de particions als vostres plans i, per tant, agilitar les vostres consultes. Això és realment un tipus de guinda del pastís.

Ara probablement heu sentit a parlar d’aguditzar i probablement pensareu: “Bé, per què heu introduït aquesta diapositiva aquí?” Aquest és un d’aquells NoSQL: aquest és un d’aquests entorns de tipus Hadoop. Oracle 12c en va publicar dos, que no són encara el G8, però que es mostra o es visualitza en previsualització en realitat. Tindreu un sistema de base de dades tradicional com Oracle i podreu eliminar com ho feu el model Hadoop, de manera que tindreu una altra tècnica de divisió i conquesta que us dividirà. Taula en forma de fila en agrupacions per node i això serà com serà el que veieu en algunes de les vostres bases de dades NoSQL. I, realment, MySQL, podeu aconseguir-ho bastant amb una de les seves tècniques de agrupament, però arriba a una base de dades tradicional i suposo que Microsoft no es voldrà deixar enrere. Aquests dos juguen saltats entre si tot el temps, així que m'esperaria veure possiblement la següent versió de SQL Server.

Gestió del cicle de vida de dades, de nou retenció obligatòria de dades, però també per a la intel·ligència empresarial i analítica. De debò, es tracta d’una tècnica de divisió i conquesta, i normalment els DBA ho fan manualment, és a dir, “vaig a mantenir les dades d’enguany en discs ràpids; les dades de l’any passat sobre discs lleugerament més lents, potser vaig conservar els dos últims anys abans que en discs encara més lents i, a continuació, tindré algun mètode d’arxiu. ”Normalment, ja no es grava, normalment és: teniu algun tipus d’emmagatzematge connectat a la xarxa o algun dispositiu que tingui molts. d’emmagatzematge i és, ja sabeu, rendible, però encara gira en disc.

Així, ara mateix, tant a Oracle com a SQL Server, podeu adquirir una opció on definiu les regles i això només passa automàticament en un segon pla. Ja no heu d’escriure guions, no heu de fer res. I si heu vist SQL Server 2016, que acaba de sortir el primer de juny, hi ha una nova funció anomenada "Bases de dades estretes" que bàsicament us permet fer-ho a la cantonada inferior dreta allà mateix, podeu passar de diverses capes directament al núvol. I, de nou, es tracta d’una característica que s’incorpora a la base de dades, només dius una cosa així com: “Si les dades tenen més de 365 dies, si us plau, traslladeu-la al núvol i, ja ho sabeu, feu-ho de manera automàtica per a mi.”

Aquesta serà una característica fantàstica, de fet estic pensant que pot ser el que veurem en el futur, que és que tindreu bases de dades híbrides on guardeu una mica de locals i alguns al núvol. Abans d’això, la gent pensava: “Ah, o vaig a fer de premissa o ho faré al núvol”. Ara veiem el matrimoni de les dues tecnologies d’aquesta manera híbrida. Crec que això serà bastant gran i Microsoft hi va arribar primer.

La redacció es deu a la protecció i al compliment de les dades. Ara bé, podríem dir ara: "Hola, desenvolupador d'aplicacions, quan el mostreu a l'informe, quan apareix a la pantalla, hi ha algunes coses de seguretat que heu de comprovar i, si us plau, només heu de mostrar les dades se suposa que veuen o emmascaren o redirigeixen les dades que no se suposa que veuen. ”Bé, com és habitual, quan la feu fora cap a l’aplicació no es fa en un lloc, de manera que es fa d’una altra manera o no. No es fa en alguns llocs. I, per tant, ara teniu aquesta capacitat als vostres sistemes de base de dades.

Ara a SQL Server 2016, aquesta característica està integrada, de manera que no és un element de cost opcional que encara estigui a la incorporació del centre de dades. i a Oracle 12 heu de comprar el seu complement de gestió del cicle de vida, però això és una novetat i el negoci el torna a impulsar. I sobretot perquè ara conserveu tantes dades i feu la mineria de dades, de manera que la BI i l’analítica, heu de saber qui accedeix a quines dades i us assegureu que només se’ls permet veure què? se'ls permet veure.

Així mateix, reviseu de nou la protecció i el compliment de les dades. Trobareu que ara molts sistemes de bases de dades creen compressió, o ho sento, xifrant directament a la base de dades i el que és important d’aquest xifratge, si mireu la fletxa cap avall i la fletxa amunt del diagrama. baixar al disc xifrat i després el llegeix a la memòria i el desxifra. En realitat, un model, hi ha un altre model que, ja ho sabeu, només ho farà quan comunica aquestes dades a la xarxa amb l’aplicació de client real.

En aquest cas, fins i tot es mantindria en el servidor de bases de dades a la memòria, es pot xifrar i desxifrar només quan s’envia a l’aplicació client. Hi ha dos models diferents aquí i els trobareu a les bases de dades, i de fet, una de les bases de dades que s’acaba d’afegir recentment va ser MariaDB a la seva versió 10.X; Jo crec que estan a 10.1 o 10.2 ara. I, realment, vaig fer algunes comparatives sobre aquest xifratge i, per obtenir aquest xifrat, només vaig experimentar un descens del 8 per cent de la velocitat de rendiment o velocitat. En una prova de benchmarking, el xifrat no va causar tant, de manera que és una característica molt útil.

Ara, hem esmentat anteriorment sobre memòria flash i SSDs i coses així. Una de les funcions que teniu a Oracle i SQL Server que molta gent no se n’adona és que podeu prendre un flaix o SSD al servidor de bases de dades i podeu dir a la base de dades: “Utilitzeu-ho com si fossin memòria. Trateu la memòria RAM com a preferència, però pretengueu que això sigui una memòria lenta i utilitzeu-la com a memòria cau estesa. ”Ara a SQL Server 2014 aquesta va sortir i es va anomenar“ Buffer Pool Extension ”, és gratuïta. A Oracle, sortia en 11g R2 i es deia "Base de dades Flash Cache" i també hi era gratuïta.

El meu consell, però, és provar detingudament aquesta funció. Cada vegada que augmenteu la memòria cau quan aneu a fer una cerca, triguen més. Si poseu una targeta flash de tres terabytes i dius a la base de dades: "Afegeix-ho a la vostra memòria", és possible que trobareu que es va retardar alguna cosa a causa del temps per mirar i veure que és en flash, és brut o neta? Hi ha un punt de disminució del retorn. El meu consell és tornar a fer aquesta unitat de prova, vegeu què funciona per a vosaltres, però de nou, es troba a la vostra base de dades i en el cas d’Oracle, tant a SQL Server com a Oracle, hi ha estat des de fa un parell d’anys.

I això ens porta a la granddaddy, que eren les bases de dades a la memòria i és perquè els preus de la base de dades han baixat. L’altra raó per la qual probablement penseu que s’ha produït és que moltes de les analítiques requereixen que les dades siguin molt ràpides i, per tant, cal que siguin a la memòria. Tingueu en compte que els algorismes que utilitzen les bases de dades per accedir a aquestes dades, per comprimir-les, xifrar-les, per emmagatzemar-les, ja sabeu que en alguns casos algunes bases de dades poden continuar emmagatzemant a la memòria com a fila.

En alguns casos, algunes bases de dades poden dividir-les en una columna orientada i la raó per la qual cosa és que aconsegueixen un nivell de compressió molt més alt, en algun lloc dels voltants de l’11 al 12X, emmagatzemant-les en ordre de columna versus ordre de fila. Aquesta primera aparició a SQL Server 2014, es deia "Hekaton". S'ha incrementat radicalment a SQL Server 2016, la veuran referenciada per alguns noms diferents i surt a l'Oracle 12c; Dic que el segon llançament aquí, no R2. Hi ha hagut dues versions diferents d'Oracle 12c, el 12.1.0.1 i el 12.1.0.2. És la segona versió de la versió R1 de la base de dades.

I la manera com el definiu, l'objecte de memòria és similar a les dues bases de dades. Aquí podeu veure a la cantonada superior dreta, estic creant un servidor SQL i podeu veure que diu amb memòria optimitzada i durabilitat només és esquema. No passaré per sobre de tots aquests significats de sintaxi i, a Oracle, és realment encara més senzill, només cal que modifiqui una taula i digui a la memòria o no, i pugueu canviar-la. Puc dir que avui és a la memòria i que demà no ho és, així que és molt flexible.

Vaig fer algunes proves a Oracle amb taules de memòria, vaig tenir unes proves que van trigar gairebé 40 minuts a executar-se, a la primera fila. El que és important és que quan arribo a les dues files inferiors, hagués augmentat el temps d'execució o disminuït, hauria de dir, fins a cinc minuts aproximadament, i quan vaig mirar el factor de compressió, les dades a la memòria eren realment 3, 6. fins a 4, 6 vegades més petit. És important perquè en aquest cas utilitzava el format orientat a les columnes i és la compressió. I, doncs, endevineu què? En realitat, encaixava gairebé quatre a cinc vegades més dades a la meva memòria. No només obtenia l’avantatge de la memòria, l’avantatge de les columnes, sinó també l’avantatge de moltes més dades: fins a cinc vegades més dades a la memòria cau de memòria, de manera que es tracta d’una tècnica força potent. Un cop més Oracle i SQL Server, voleu mirar-los, són funcions reals. I amb això, crec que ho obriré a preguntes.

Eric Kavanagh: Bé, primer de tot heu estat molt desinteressats en tota aquesta meravellosa educació. Podríeu parlar només per un minut sobre el que feu els nois? Perquè teniu una tecnologia habilitant que us pot facilitar el que heu estat parlant. N’hi ha prou amb parlar-ne un minut sobre què fan els vostres nois i, a continuació, deixem que Dez i Robin baixin de l’equació aquí.

Bert Scalzo: Sí, treballo en una empresa que es diu IDERA. Estem a Texas, tenim la seu a Houston i, actualment, estic a Austin, però estic a Dallas. Fem eines de base de dades i fem eines de base de dades per ajudar-vos a resoldre problemes. Aquest problema pot ser una cosa tan senzilla com la productivitat, en aquest cas tenim una eina anomenada DBArtisan que us permet fer les tasques administratives de la vostra base de dades i és una eina que us permetrà gestionar 12 plataformes de bases de dades diferents. Puc gestionar SQL Server, puc gestionar Oracle, puc gestionar MySQL, DB2, Postgres i faig servir una eina, una executable, una de GUI i un conjunt de fluxos de treball consistents. També fabriquem eines per fer el compliment, tenim una eina anomenada SQL Compliance Manager per ajudar-vos a satisfer les vostres necessitats de compliment. Una altra eina anomenada SQL Security, de manera que intentem que les eines que us ajudaran siguin efectives i eficients, i el que és realment bo si aneu al nostre lloc web, tenim tot un munt de freeware per la qual cosa, si no és més, aneu a descarregar. - Crec que tenim 20 o 25 freewares. Hi ha algunes coses del freeware molt bones, com ara que hi hagi un SQL Server i un Windows Check Check, que bàsicament es fixarà en el que teniu i us dirà si teniu problemes o coses, i que és totalment gratuït.

Eric Kavanagh: I tu realment …

Bert Scalzo: Definitivament, les primeres coses …

Eric Kavanagh: Avui parles de l'heterogeneïtat del mercat actual, hi havia una mena d'equació única que s'adapta a la mida que, de fet, recordo que vaig entrevistar el doctor Michael Stonebraker quan el 2005 va continuar. va ser una gran empenta parlant de veredicte sobre el moviment de bases de dades orientat a les columnes i va estar parlant de com dominava durant molts anys el model relacional de mida única, i va predir que tot canviaria, i el noi tenia raó. això. Ara tenim aquest entorn realment interessant i divers, amb moltes opcions i oportunitats diferents, però necessiteu que algú pugui gestionar-ho i em sembla que la vostra empresa es concentra força acurada a resoldre problemes de matemàtiques, sent així un facilitador de la capçalera d’heterogeneïtat, oi?

Bert Scalzo: Absolutament. Vull dir que sempre hi haurà DBA que diuen: "No vull utilitzar una eina GUI, ho faig tot amb scripts", saps? Creuen que són el tipus de DBA superman i està bé, però per a la majoria de nosaltres, volem fer feina i, ja ho sabeu, faig servir Microsoft Word per escriure els meus documents. Utilitzo Microsoft Outlook per fer el meu correu electrònic. Vull dir, tinc eines per fer tasques. Construïm el mateix tipus de concepte, estem construint eines per a administradors i desenvolupadors de bases de dades per ajudar-los a centrar-se en el que volen fer i no com ho han de fer.

Eric Kavanagh: Té sentit, però permeteu-me que us dirigeixi als nostres experts i que la gent no se senti lliure per endinsar-vos. Tenim un parell de comentaris que arriben per part del públic. Potser, Dez, un parell de preguntes i Robin un parell de preguntes?

Dez Blanchfield: Segur. Una de les primeres preguntes que vull llançar a vosaltres, donada l’enorme experiència d’experiència que heu aconseguit, veieu aviat un moment en què alguna cosa d’això es redueixi? O creieu que estem realment al punt d'entrada d'aquesta línia de canvi contínua? Crec que un dels grans problemes que tenen les empreses i, sempre, les persones que intenten donar suport a la tecnologia que proporcionen aquestes empreses per gestionar els seus negocis, és que la taxa de canvi és tan dramàtica que no poden estar al dia de tot. apareixen les diferents funcions i programari i sistemes i marcs i arquitectures i el codi nou, i el maquinari que hi ha a sota, veieu que el ritme actual de canvis es redueix immediatament? Vull dir que, teniu una àmplia gamma de plataformes amb tota la suite IDERA, anirem alentint-nos aviat o estem en aquest tipus de trens de mercaderies desbocats des de fa temps?

Bert Scalzo: Crec que som al primer 20 per cent d'aquesta curva de creixement i ens queda molt per recórrer, i hi ha dues coses que ho impulsen. La tecnologia continua evolucionant. Heu esmentat alguns dels nous tipus de memòria que sortiran, que serà fantàstic. Samsung tindrà una unitat flash de 20 terabytes aquí aviat. Això canviarà les coses. Tenim totes aquestes bases de dades NoSQL i núvol, això no deixa de continuar. Una cosa tan curiosa, però, és quan miro bases de dades com Oracle i SQL Server i algunes altres, ja no són bases de dades relacionals. Puc posar dades no estructurades a Oracle i, tot i així, mantenir la conformitat amb l’ACID. Si m’ho haguessis dit, fa vint anys, només hauria dit que estàveu en drogues.

Dez Blanchfield: Sí, sí, són fantàstics. Doncs bé, ara mateix aquells motors que tenen uns nínxols verticals força bonics com el SIG, ara millor que la capacitat nativa. Heu fet uns comentaris fantàstics sobre els reptes que tenen els DBA i les diferents èpoques dels DBA que esperem veure a tot el lloc, però com és el món que té aquest tipus de negoci que us ocupa? Vull dir, es tracta de les persones que utilitzen les diferents plataformes del vostre gestor de diagnòstic, de les eines d’inventari i, fins i tot, baixant al desgranat, de com s’afronten els DBA amb aquest canvi i com ho fan?, què fan amb les vostres eines per afrontar aquest canvi significatiu en el seu paisatge?

Bert Scalzo: Bé, vaig a tornar fa gairebé 20 anys, i diré que els DBA resolen un paper molt específic en una organització. Normalment treballen amb una plataforma de bases de dades, potser dues, i van gestionar un nombre relativament reduït de bases de dades. Avui aviat i l’administrador de bases de dades, en realitat coneixerà 10 plataformes de bases de dades. Ell gestiona, i això no és cap broma, en alguns casos milers de bases de dades; això és més sobre el món de SQL Server o el món de MySQL. Però encara al món d’Oracle podrien gestionar centenars de bases de dades. Així, ja que surten totes aquestes noves funcions, tenen totes aquestes noves plataformes i tenen totes aquestes bases de dades de les quals són responsables. Cerquen eines que permetin la seva productivitat i també que els ajudin a aprendre algunes coses.

I us posaré un exemple: si vull particionar una taula és una sintaxi força obscura, i si vull sub-particionar-la, la sintaxi és encara més difícil. Sé què vull fer, vull crear cubs. Si tinc una eina com DBArtisan que diu: "Hola, aquí tens una bonica pantalla que et permet concentrar-te en el que estàs intentant fer en lloc de com ho intentes, i, per cert, empeny Mostra el botó SQL quan hagueu acabat i us mostrarem què era el SQL perquè pugueu començar a aprendre i dominar-ho realment. "

Els DBA estan descobrint que les eines que els ajuden a fer la feina, però també els ajuden a ensenyar-los totes aquestes coses noves que estan utilitzant i el mateix seria cert: diguem que sóc un tipus d’Oracle i passo a MySQL i diguem, “D’acord, crea una base de dades, DBArtisan. Ara demostra’m la SQL perquè em pregunto com és crear una base de dades a MySQL i només he après a sintaxi. ”I així no només els ajudem a treballar a través de bases de dades, també els estem educant a través de bases de dades.

Dez Blanchfield: És encara més interessant quan sortiu a alguns dels més moderns, o no més moderns, això no és gens just de dir, però una vegada una base de dades és una base de dades. Aquests dies veig tot allò que parleu allà amb el repte afegit que la tecnologia aplega que tradicionalment veiem dels venedors i hi trieu un tipus de codi obert i que també són bons. No només tracten els motors de bases de dades i els llenguatges de consulta, sinó que també s’ocupen dels tipus de dades, els estructurats i no estructurats, que saps, el repte d’haver d’afrontar-ho tot, des de l’extrem extrem de l’espectre d’un HDFS multi-petabyte. entorns a contenidors petits minúsculs i fitxers de paquets i diversos formats de fitxers de registre.

I crec que això és una cosa que ara veiem on només no hi ha un ésser humà, per molt que sigui un superhome, una superwoman, sigui el que poguessin pensar que siguin, físicament, no poden afrontar mentalment aquesta taxa de canvis i l’escala de variacions. Crec que el conjunt d’eines que ofereu ara arribarà a un punt en què gairebé tindran un conjunt predeterminat de moltes maneres de manera que no puguem executar els entorns de bases de dades que tinguem sense ells perquè físicament No puc tirar-hi tants cossos. Em va agradar molt la vostra presentació. Passaré al doctor Robin Bloor, estic segur que també té moltes preguntes per llançar-te.

Robin Bloor: D'acord. Bé, sens dubte tinc preguntes. Bert, no sé cap a on vas, vaig tenir una conversa realment interessant fa uns dies on algú va començar a parlar-me sobre la protecció de dades de DU més recent i em va semblar el que deien que era increïblement draconià pel que fa a les coses en què insistien. Em vaig preguntar si realment ho miraries; és alguna cosa que coneixeu?

Bert Scalzo: Absolutament. Sí.

Robin Bloor: 2016, d'acord, explica'ns-ho.

Bert Scalzo: i realment …

Robin Bloor: Profundament interessant.

Bert Scalzo: En realitat vaig treballar durant un temps per a un venedor de flaix, a la seva zona de bases de dades ajudant-los a crear productes flash per a bases de dades, i puc dir que el draconià es redueix. El que vull dir és que, si recordeu la meva diapositiva, he dit que en algunes bases de dades farà el xifrat, però la posa a la memòria del servidor i en algunes bases de dades el xifrat; encara es xifra a la memòria del servidor, només es desxifra quan s'envia al client. Doncs el que també trobareu és algunes d’aquestes normes governamentals, sobretot el Departament de Defensa o militars aquí als Estats Units, també van fins al nivell de flaix i també volen saber que no admetu el xifratge i el xifratge. el vostre maquinari, però que si algú robés els xips que, ja ho sabeu, els va treure de la cosa, fora del vostre servidor, que el que hi ha està xifrat i, tot i que encara que tinguin l'emmagatzematge, no es pot i ho farien. fins a l'actual, no a la part del flaix, sinó a les fitxes individuals. Volien saber que xip per xip, tot estava xifrat.

Robin Bloor: Wow. Vull dir que hi ha moltes coses que, ja ho sabeu, crec que només heu plantejat una o dues diapositives, però era una cosa que és realment interessant. La redacció d’informació, per exemple, ha de ser una mica més intel·ligent que simplement emmascarar diversos camps, ja que sobretot amb l’aprenentatge automàtic actualment, podeu fer coses deductives que us permeten treure informació que abans no podríeu treure.

Si intenteu protegir, diguem-ne informació sanitària, és a dir, que són una regla molt dràstica als EUA pel que fa a informació sobre salut, però realment, utilitzant diverses tècniques d’aprenentatge de màquines, sovint podeu esbrinar qui és la informació mèdica d’algú. en realitat ho és Em vaig preguntar si teniu alguna cosa a dir sobre això perquè tots pensen que és una zona interessant.

Bert Scalzo: Sí, absolutament, i només estic fent servir això com a exemple, no intento dir que una base de dades és millor que una altra, però aquest és un molt bon exemple per al que acaba de preguntar. A Oracle, per exemple, si no em permet veure una fila de dades, com ara, no em permet veure el registre mèdic de John Smith. A Oracle si dic: "Selecciona aquell registre", estaré bloquejat o tindré la possibilitat de veure el que tinc permès de veure i es tornarà a reproduir. I si dic: "Seleccionem l'estrella del compte de la taula on és igual a John Smith", obtindré el zero.

A SQL Server, pot fer la redacció, però té alguns forats. Si dic: "Selecciona l'estrella del compte de la taula on és igual a John Smith", realment recuperaré una, així que sé que hi ha un John Smith. L’un és més segur que l’altre. Ara espero que arreglin això, sempre toquen granota amb els altres. I, de nou, no intento diferenciar entre les bases de dades que no sigui mostrar un exemple de: mira el que estem parlant ara, una cosa tan simple com el compte selecte també ha de ser tallat per la redacció, tot i que, tècnicament parlant, no hi ha res que no es redueixi que l'existència de la fila.

Robin Bloor: Sí, no. És interessant. Vull dir, una altra pregunta general, perquè no tinc gaire temps, es tracta realment de les millores. Vull dir que heu estat en un lloc on sé que ens heu mostrat exemples de diversos resultats de proves que heu executat. Creieu que les bases de dades tradicionals, anomenem-les bases de dades dominants, SQL Server i Oracle? creu que continuaran abans de la realització? O creieu que es deixaran atrapar per un o altre tipus de trastorns del mercat que realment operen? Quina és la teva opinió?

Bert Scalzo: Tinc una opinió i és, ja ho sabeu, una altra vegada vaig a dir que és la meva opinió. Microsoft, per exemple, a l'era post-Ballmer només m'impressiona l'infern viu. Em refereixo a que aquesta base de dades estreta obté SQL Server a Linux, passa a .NET a Linux, a PowerShell a Linux; No crec que es deixin enrere els venedors de bases de dades tradicionals. Crec que han decidit: "Ei, deixeu que els nous nois, les startups defineixin alguna cosa. Permetin-los esbrinar què és el perfeccionament i com s’ha de perfeccionar, i un cop realitzades totes les investigacions i desenvolupament, sabem exactament què volen els usuaris, ara afegim la nitidesa a Oracle. dient: "Hola, ser segon o tercer no està malament quan ets el jugador dominant, perquè la gent no migrarà de tu."

Robin Bloor: Sí, vull dir que és una estratègia que s’ha fet servir. Vull dir que IBM solia fer-ho i tot el conjunt de les seves gammes de productes, i raonen bastant bé fins que algú surti completament fora del mur que ningú no ha pensat mai, però que no es pot planificar contra això, de totes maneres.

Preguntes del públic, Eric?

Eric Kavanagh: Sí, però teniu temps que crec que només per a un potser i sé que Bert ha de córrer. Hi havia alguna cosa aquí: d'acord, l'arquitectura d'esmicoladora d'Oracle 12c és que indiqui - o què és una indicació al vostre parer, què creieu que està passant allà?

Bert Scalzo: Bé, Oracle absorbeix o ofereix tots els proveïdors de bases de dades. Per exemple, puc posar dades no estructurades a Oracle. No sé com podeu posar dades no estructurades i, a continuació, anomenar-la base de dades relacional, de manera que no té cap sentit, però podeu fer-ho. I ara Oracle està afegint nitidesa, així que Oracle diu: "Sabeu què? Tot el que el mercat vulgui, farem la nostra base de dades d’oferta perquè el mercat vol allò que el mercat vol i oferim la solució, volem que es quedin amb nosaltres. ”

Crec que veureu articles addicionals. No m'estranyaria que agrupés els nodes de bases de dades en forma de Hadoop no en un creador d'Oracle o en un clúster d'aplicacions reals, però bàsicament en una agrupació tradicional de tipus Hadoop fent aquesta nitidació. Així doncs, crec que podreu desplegar una base de dades com Oracle, com si fos un Hadoop, i aquest tipus de tendències continuaran. Aquests grans venedors de bases de dades, fabriquen milers de milions de dòlars i no volen perdre el mercat, de manera que estan disposats a adaptar-se a qualsevol cosa o a adoptar res.

Eric Kavanagh: Bé, ja ho sabeu, és curiós perquè he seguit els venedors de codi obert durant força temps i m’he preguntat tot això, com serà d’impacte la tecnologia tradicional de portes tancades i durant un temps Segurament sentia que els venedors de codi obert estaven avançant seriosament, i ara quan miro el mercat veig una mica el que estàs dient, que els nois grans han fet les seves matemàtiques, han aguditzat els llapis i han descobert com poden teixir moltes coses a les seves arquitectures. Tant si es tracta d’IBM, com d’Oracle, o SAP, vaig estar a la Conferència SapphireNow del mes passat i Steve Lucas, que dirigeix ​​la meitat d’aquesta empresa, es va vantar que SAP ara incorpori a la seva plataforma de núvols HANA, components de codi més obert que cap dels seus. competidors. Si feu les matemàtiques sobre això, és una afirmació força impressionant i em diu que els nois grans no van a cap lloc en cap moment.

Bert Scalzo: No, apostaria pels meus diners pels dos. Vull dir que si us fixeu, les accions de Microsoft fa poc que eren d’uns 50 dòlars i, ja ho sabeu, fa uns anys era a 25. No duplicareu el preu de les vostres accions en un termini curt, tret que feu coses bones i, ja ho sabeu, des de fer tot, des de Windows 10 ser gratuït durant el primer any fins a totes les altres coses intel·ligents que facin, aquesta característica de base de dades extensa crec que és fenomenal. Crec que el que passarà és que molta gent acabarà a l'azur, no directament, com no van dir: "Emigrem la meva base de dades cap a Azure". Migrarà cap allà màgicament perquè s'arxivarà. Allà, amb aquesta nova característica de base de dades d'estiració i, per tant, l'adopció d'Azure acabarà disparant.

Eric Kavanagh: Bé, aquesta és una de les tendències del mercat que fins i tot puc veure, fins i tot al vostre Mac. A mesura que aneu al vostre Mac per desar alguns documents, ara, i els nous Macs només segueixen pel núvol, oi? Vull dir, hi ha molt de sentit en aquesta estratègia i també la miro i vaig: “D'acord, nois, intentes atraure'm peça a peça al teu entorn de núvol i, un dia, quan vull veure alguna pel·lícula si La meva targeta de crèdit ha caducat: tindré problemes. "

Bert Scalzo: Sí, però ho fas a Facebook.

Eric Kavanagh: Sí. Això és cert.

Bert Scalzo: ho poses tot a Facebook.

Eric Kavanagh: Bé, no tot.

Bert Scalzo: No, vull dir …

Eric Kavanagh: Sí, endavant.

Bert Scalzo: Aquestes tendències socials estan arribant a les empreses. Ara les empreses encara tenen moltes altres coses que fer, però veuen aquestes tendències i fan el mateix tipus de coses. No veig ni Oracle ni Microsoft se'n van. De fet, vaig a comprar estoc a tots dos cada vegada que hi hagi un bany.

Eric Kavanagh: Sí, certament. Doncs gent, aneu a idera.com, IDERA dot com. Tal com va dir Bert, tenen tot un munt de coses gratuïtes allà mateix i és una de les noves tendències del mercat: us ofereixen algunes coses gratuïtes per jugar, enganxar-vos, i després comprar les coses reals.

Persones, aquesta ha estat una altra tecnologia calenta. Gràcies pel vostre temps avui, Bert, Dez per descomptat, i Robin també. En parlarem la setmana que ve, gent, moltes coses que passen. Si teniu alguna idea, no dubteu en enviar-vos per correu electrònic de veritat, . Ja en parlarem la propera vegada, tingueu cura. Adeu.

Impuls endavant: avançant relacionalment més enllà del tradicional