Digitalizarea viitoare a plăcilor de la Big Data la Smart Data

Munchen 04/01/2020

Tehnologia grafică: de la big data la date inteligente?

Dacă datele vor fi „inteligente”, acestea trebuie pregătite în consecință. Problema anterioară: Datele sunt foarte eterogene, deseori nestructurate și adormite în diferite locații din baze de date separate (silozuri de date). În plus, informațiile nu sunt de obicei căutabile sau sunt foarte dificil de căutat.

Alexander Jarasch

Pentru a recupera comorile ascunse și a obține ipoteze din acestea, datele trebuie să fie accesibile, interoperabile și căutabile - numai atunci „Big Data” poate fi transformată în „Smart Data” prin utilizarea soluțiilor IT moderne. Exact la asta lucrează proiectul „Graficele pentru a lupta împotriva diabetului” al Centrului German pentru Cercetarea Diabetului (DZD) din München cu ajutorul tehnologiei graficelor. Echipa speră că conexiunea și analiza sistematică a datelor și A. Ipoteze o prevenire și terapie personalizate. Chiar și cu un subiect fierbinte, cum ar fi infecțiile cu Covid-19, tehnologia grafică poate stabili conexiuni care ar fi putut rămâne ascunse fără această metodă. Într-un interviu, Dr. Alexander Jarasch, cum funcționează.

Dr. Alexander Jarasch, München

Dr. Jarasch, există o bază de date foarte mare de date despre diabet la nivel mondial. Care este problema cu asta?
Există date din cele mai diverse discipline de cercetare de bază, experimente pe animale, din studii epidemiologice la universități și studii clinice din spitalele universitare. Cu toate acestea, datele generate în acest proces sunt de obicei înregistrate în așa-numitele silozuri de date, adică în tabele Excel, fișiere text sau, în cel mai bun caz, în baze de date. Aceste date nu sunt atunci sau sunt legate doar foarte rudimentar. Acesta este motivul pentru care este dificil să se stabilească legături între diferite proiecte de cercetare care se ocupă cu diabetul în diferite moduri.

Și aici intervine tehnologia grafică?
Sunt de acord. În bazele de date grafice, datele sunt legate nativ ca așa-numitele noduri și margini. De exemplu: economisesc IMC, înălțime și așa mai departe pe nodul persoană al pacientului. Dacă atunci se efectuează un experiment pe acest pacient, în care, de exemplu, se extrage sânge și se măsoară valoarea HbA1c, creez un nou nod „extragere de sânge”. Pe aceasta economisesc cantitatea de probă de sânge, valoarea HbA1c, stocată în frigiderul XY etc. Nodurile „Persoană” și „Extragerea sângelui” sunt apoi conectate printr-o margine. Apoi, pot vedea direct, de exemplu, ce valoare HbA1c are o persoană, ce IMC are și unde este stocată proba. Acum pot căuta similitudini între oameni și astfel pot face ipoteze despre conexiuni. Și cu cât alimentez mai multe date în baza de date a graficelor, cu atât sunt mai probabil să găsesc corelații sau tipare.

Cum utilizați această tehnologie în DZD?
De exemplu, pentru locația noastră, disciplina și interogarea între specii de experimente și probe. Prof. Martin Hrabě de Angelis, membru al consiliului nostru de administrație al DZD, a avut viziunea unui „catalog de date” în DZD. Cu aceasta putem determina relativ simplu: Unde sunt stocate datele? Am voie chiar să lucrez cu tine din motive de protecție a datelor? Și câte mostre am? Să presupunem că vreau să fac o declarație statistică despre un parametru într-un experiment de șoarece cu 20 de șoareci. Cu toate acestea, numărul nu este suficient pentru a face afirmații semnificative statistic. În baza de date a graficului, ați putut vedea că 5.800 de șoareci cu același parametru au fost măsurați într-o altă locație a DZD - și apoi pot combina aceste date.

Sistemul nu devine din ce în ce mai confuz cu atât mai multe date sunt îmbinate?
Nu. Trucul este că avem o suprafață interactivă pe care medicii și oamenii de știință fără o experiență în informatică o pot folosi pentru a-și găsi drumul. Puteți glisa nodurile și marginile înainte și înapoi, derulați-le pentru a vedea detalii și noduri legate, pliați-le pentru a vedea imaginea de ansamblu. În acest fel, analizele de date complet noi pot fi operate interactiv. Dacă numărul de noduri și margini devine semnificativ mai mare, puteți trimite și interogări la baza de date cu un limbaj de interogare foarte simplu.

De asemenea, puteți utiliza tehnologia grafică pentru a lega datele de cercetare pe diferite imagini clinice?
Acesta este următorul pas. Deoarece tehnologia este universal aplicabilă și poate fi ușor extinsă sau modificată. Iar puterea de calcul a computerelor este acum atât de mare încât pot fi procesate cantități uriașe de date. În prezent, avem un pilot cu alte centre germane de cercetare în domeniul sănătății, cu 1,8 miliarde de noduri și 3,9 miliarde de margini!

Despre ce este acest proiect pilot?
Este vorba despre posibile sechele ale diabetului. De exemplu, unul este un cancer hepatic destul de agresiv. Acum apare întrebarea: Există date de la pacienți sau în modele animale care ar sugera diabetul la cancer sau invers? De exemplu, un defect genetic, un factor de mediu, un anumit stil de viață? Posibilitățile de aplicare ale tehnologiei grafice sunt nelimitate. De aceea va juca un rol din ce în ce mai important în viitor.

Mulțumesc pentru interviu, Dr. Jarasch!

Mai multe informatii

Puteți citi mai multe despre tehnologia graficelor în Raportul D.U.T 2020 la pagina 160 în articolul „Date în rețea pentru cercetarea viitoare a diabetului” de Dr. Alexander Jarasch, Dr. Astrid Glaser și prof. Dr. Martin Hrabě de Angelis.

Puteți găsi mai multe informații despre proiectul „Grafice pentru combaterea diabetului”, care a fost distins cu locul 2 la bytes4diabetes Award, AICI.