Nieuw $ 10 miljoen NSF-gefinancierd instituut komt tot de KERN van datawetenschap

Artikel Inhoud

Een nieuw initiatief van de National Science Foundation heeft geleid tot een instituut van $ 10 miljoen dollar, geleid door computer- en datawetenschappers van de University of California San Diego, dat tot doel heeft de kernfundamenten van het snel opkomende gebied van datawetenschap te transformeren.

Het instituut, genaamd The Institute for Emerging CORE Methods in Data Science (EnCORE), zal worden gehuisvest in het Department of Computer Science and Engineering (CSE), in samenwerking met The Halıcıoğlu Data Science Institute (HDSI), en zal een reeks belangrijke problemen in theoretische grondslagen van Data Science.

Afbeelding

Het EnCORE-instituut zal worden geleid door CSE en HDSI Associate Professor Barna Saha.

UC San Diego-teamleden zullen samenwerken met onderzoekers van drie partnerinstellingen – University of Pennsylvania, University of Texas in Austin en University of California, Los Angeles – om vier kernaspecten van datawetenschap te transformeren: complexiteit van gegevens, optimalisatie, verantwoord computergebruik en onderwijs en betrokkenheid.

EnCORE zal zich aansluiten bij drie andere door NSF gefinancierde instituten in het land die zich toeleggen op de verkenning van datawetenschap via het NSF’s Transdisciplinary Research in Principles of Data Science Phase II (TRIPODS)-programma.

„De NSF TRIPODS-instituten zullen vooruitgang brengen in de datawetenschapstheorie die de gezondheidszorg, productie en vele andere toepassingen en industrieën die gegevens gebruiken voor besluitvorming verbeteren“, zegt Shekhar Bhansali, divisiedirecteur van de NSF-divisie voor elektrische, communicatie- en cybersystemen.

Kanselier Pradeep K. Khosla van UC San Diego zei dat de zeer collaboratieve, multidisciplinaire gemeenschap van UC San Diego de perfecte omgeving is om EnCORE te lanceren en te ontwikkelen. “We hebben een lange geschiedenis van succesvolle interdisciplinaire samenwerking op en buiten de campus, met gerenommeerde onderzoeksinstellingen in het hele land. UC San Diego is ook de thuisbasis van het San Diego Supercomputer Center, de HDSI en toonaangevende onderzoekers op het gebied van kunstmatige intelligentie en machine learning, „zei Khosla. „We hebben de capaciteit om een ​​breed scala aan enorme en complexe datasets van enkele van de meest briljante geesten van onze tijd te huisvesten en analyseren, en die kennis vervolgens met de wereld te delen.“

Barna Saha, de EnCORE-projectleider en een universitair hoofddocent aan de afdeling Computer Science and Engineering en HDSI van UC San Diego, zei: „We zien dat EnCORE een centrum zal worden van theoretisch onderzoek op het gebied van informatica en datawetenschap in Zuid-Californië. Zo’n nationaal instituut ontbrak in deze regio, die veel talent heeft. Dit zal een broodnodige leemte opvullen.”

Afbeelding

De kern van EnCORE: co-hoofdonderzoekers omvatten (van links naar rechts) Yusu Wang, Barna Saha (de hoofdonderzoeker), Kamalika Chaudhuri, (bovenste rij) Arya Mazumdar en Sanjoy Dasgupta. (Niet afgebeeld, Gal Mishne).

De andere UC San Diego-faculteitsleden in het instituut zijn professoren Kamalika Chaudhuri en Sanjoy Dasgupta van CSE; Arya Mazumdar, Gal Mishne en Yusu Wang van HDSI; en Fan Chung Graham van CSE en de afdeling Wiskunde. Saura Naderi van HDSI zal de outreach-activiteiten van het instituut leiden.

“Professor Barna Saha heeft een team van uitzonderlijke wetenschappers bijeengebracht in UC San Diego en in het hele land om de basis van datawetenschap te onderzoeken. Dit soort instituten, gericht op grensverleggend onderzoek, innovatief onderwijs en effectieve outreach, zal de komende jaren een model zijn voor interdisciplinaire initiatieven”, zegt Sorin Lerner, voorzitter van de afdeling Computerwetenschappen en Engineering.

KERNpijlers van datawetenschap

Het EnCORE Institute wil drie onderzoeksaspecten van Data Science onderzoeken en transformeren:

  • C, voor Complexities of Data: gegevens waarmee de onderzoekers te maken hebben, zijn complex, van enorme omvang en lawaaierig. Ze zullen onderzoeken welke nieuwe tools en benaderingen nodig zijn om de complexiteit van gegevens aan te pakken, inclusief een herziening van de concepten van algoritmen, statistiek en machine learning.
  • O, voor optimalisatie: een heel oud en traditioneel veld, het moet nu datagedreven zijn, wat nieuwe uitdagingen met zich meebrengt. Moderne data en technologie hebben een grote kloof gecreëerd tussen theorie en praktijk van optimalisatie. Adaptieve methoden en menselijk ingrijpen kunnen leiden tot grote vooruitgang in machine learning.
  • R, voor verantwoord leren: de ethische verantwoordelijkheid van wanneer onderzoekers te maken hebben met massale gegevens, gegevens met gevoelige informatie en die gegevens gebruiken om beslissingen te nemen, moet worden geheroriënteerd om zich aan te passen aan een onzekere wereld.

“EnCORE vertegenwoordigt precies het soort talentconvergentie dat nodig is om de opkomende maatschappelijke behoefte aan verantwoord gebruik van data aan te pakken. Als campushub voor datawetenschap is HDSI trots op een boeiende talentenpool om samen te werken om het veld vooruit te helpen”, aldus Rajesh K. Gupta, oprichter van HDSI.

Teamleden waren enthousiast over de mogelijkheid van interdisciplinair onderzoek dat het instituut zal bieden. Ze zullen samenwerken om machine learning en robuust leren met behoud van privacy te verbeteren, en geometrische en topologische ideeën te integreren met algoritmen en machine learning-methodologieën om de complexiteit van moderne gegevens te temmen. Ze voorzien een nieuw tijdperk in optimalisatie met de aanwezigheid van sterke statistische en computationele componenten die nieuwe uitdagingen toevoegen.

„Een van de opwindende onderzoeksactiviteiten van EnCORE is datawetenschap voor het versnellen van wetenschappelijke ontdekkingen in domeinwetenschappen“, zegt Gal Mishne, een assistent-professor bij HDSI. Als onderdeel van EnCORE zal het team in samenwerking met domeinexperts snelle, robuuste visualisatietools met weinig vervorming ontwikkelen voor real-world data. Daarnaast zal het team hulpmiddelen voor geometrische data-analyse ontwikkelen voor neurowetenschappen, een veld dat een explosie van gegevens op meerdere schalen ondergaat.

Van K-12 en verder

Een onderscheidend aspect van EnCORE is de component ‚E‘, educatie en betrokkenheid.

Het instituut zal studenten op alle niveaus betrekken, van K-12 tot postdoctorale studenten, en junior docenten, en uitgebreide outreach-activiteiten uitvoeren op al zijn vier locaties.

De geografische reikwijdte van het instituut in drie regio’s van de Verenigde Staten zal een voordeel zijn, aangezien het instituut zijn outreach-plan uitvoert, dat regelmatige workshops, evenementen, het inhuren van studenten en postdoctorale studenten omvat. Er zullen ook online en gezamenlijke cursussen tussen de partnerinstellingen worden aangeboden.

Activiteiten om middelbare scholieren, middelbare scholieren en basisscholen in Zuid-Californië te bereiken, maken ook deel uit van het plan van het instituut, met de eerste afspraak voor deze zomer met het Sweetwater Union High School District om studenten te leren over de fundamenten van datawetenschap.

Er zullen ook mentorschaps- en trainingsmogelijkheden zijn met onderzoekers die zijn aangesloten bij EnCORE, wat zal helpen een pijplijn van datawetenschappers te creëren en het bereik en de impact van het veld te vergroten. Daarnaast wordt er samengewerkt met de industrie.

Mazumdar, een universitair hoofddocent in de HDSI en een aangesloten faculteitslid in CSE, zei dat het team al veel aandacht en moeite heeft gestoken in het ontwikkelen van datawetenschapscurricula op alle niveaus. „We streven ernaar een generatie experts te creëren die rekening houden met de behoeften van de samenleving en de eisen van de industrie erkennen“, zei hij.

„We hebben contacten gelegd met tal van industriële partners, waaronder vooraanstaande datawetenschapstechnologieën en ook met lokale industrieën in Zuid-Californië, waaronder start-ups, die actief betrokken zullen zijn bij het instituut en ons op de hoogte zullen houden van hun behoeften“, voegde Mazumdar eraan toe.

Een interdisciplinair, divers veld- en team

Datawetenschap heeft voetsporen in de informatica, wiskunde, statistiek en engineering. In die geest hebben de onderzoekers van de vier deelnemende instellingen die het kernteam vormen, uiteenlopende achtergronden uit vier disciplines.

“Data science is een nieuw en zeer interdisciplinair gebied. Om significante vooruitgang te boeken in Data Science heb je expertise nodig uit deze diverse disciplines. En het is erg moeilijk om experts op al deze gebieden onder één afdeling te vinden”, zegt Saha. “Om vooruitgang te boeken in Data Science, heb je samenwerkingen uit verschillende disciplines en een scala aan expertise nodig. Ik denk dat dit instituut die mogelijkheid biedt.”

En het instituut zal diversiteit in de wetenschap bevorderen, aangezien EnCORE wordt geleid door vrouwen die toonaangevend zijn in hun vakgebied.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert