Werken met datawetenschappers om online chemische extractie en analyse te verbeteren

Deze blog is een samenwerking tussen LCGC en de American Chemical Society Analytical Division Subdivision on Chromatography and Separations Chemistry.

In het verleden heb ik openlijk geklaagd over het schijnbare gebrek aan steun van de National Science Foundation (NSF) voor onderzoek naar fundamentele scheidingswetenschap. In dat sentiment ben ik niet de enige geweest. Afgelopen herfst was ik bemoedigd toen ik een NSF-subsidie ​​(CHE-2108767) ontving ter ondersteuning van verkenningen naar hoe datawetenschapstechnieken kunnen worden gebruikt om complexe online extractie- en analysesystemen vooruit te helpen. Ik ben bereid om mijn woorden uit het verleden tot op zekere hoogte op te eten. Hoewel ik denk dat er altijd meer federale onderzoeksondersteuning kan worden geboden, onderzoeken we met deze projectondersteuning fundamentele relaties tussen de structuren van moleculen en hun interactie met verschillende materialen, in de context van online superkritische vloeistofextractie-superkritische vloeistofchromatografie (SFE ) -SFC).

We werken samen met het Center on Stochastic Modeling, Optimization, and Statistics (COSMOS) van de afdeling Industrial Engineering van de University of Texas in Arlington. We benaderden deze groep, onder leiding van profs. Victoria Chen en Jay Rosenberger, toen we ons realiseerden dat onze pogingen om standaard multivariate optimalisatie voor SFE-SFC(1) te gebruiken, op de lange termijn misschien te kort schieten. SFE-SFC is een extreem krachtig analytisch systeem, maar het is vrij complex in het aantal variabelen dat moet worden overwogen en geoptimaliseerd voor nieuwe toepassingen.

Hoewel ik niet van plan ben in te gaan op de moeren en bouten van de volledige projectdetails, is het onze bedoeling om machine learning en surrogaat-optimalisatietechnieken te combineren om efficiënt optimale SFE-SFC-omstandigheden te bereiken voor een breed scala aan toepassingen. Een grote uitdaging is om een ​​methodologie te ontwikkelen die voor een breed scala aan molecuultypen en materialen kan werken. Van SFE en SFC is bekend dat ze toepasbaar zijn in een groot deel van de ruimte die zowel met gaschromatografie als met vloeistofchromatografie kan worden geanalyseerd. De beschouwde materialen zijn die welke de moleculen kunnen bevatten waaruit ze moeten worden geëxtraheerd (zoals monstermaterialen), evenals de SFC-stationaire fasen, die worden gebruikt om de moleculen zowel op te vangen als te scheiden.

Het afleiden van parameters geassocieerd met een bepaald molecuul die voorspellend zijn voor zijn fysisch-chemische eigenschappen, evenals zijn interacties met een grote verscheidenheid aan materialen, is ook een uitdaging. Aan de ene kant kan er veel worden gedaan door lineaire solvatatie-energierelaties te bepalen voor opgeloste stoffen die gedetailleerde eigenschapsdescriptoren hebben, maar de reeksen moleculen waarvan deze descriptoren bekend zijn, zijn beperkt, en de descriptoren zijn niet gemakkelijk te bepalen voor andere moleculen van belang. Aan de andere kant bieden eigenschappen die gemakkelijk te berekenen zijn, zoals pKa of log P, een beperkte voorspellingscapaciteit wanneer de moleculen aanwezig zijn in complexe systemen.

Met dat in gedachten hebben we besloten om methoden voor machinaal leren na te streven, die de feitelijke chemische structuur van de verbinding kunnen coderen en deze kunnen correleren met gemeten eigenschappen. Dit soort werk wordt nagestreefd in de ontdekking en synthese van geneesmiddelen, maar tot nu toe slechts in zeer beperkte mate in de analytische chemie.

Om de beste coderingsstrategie voor de twee- en driedimensionale chemische structuren te bepalen, hebben we het potentieel onderzocht om vacuüm-ultraviolette (VUV) absorptiespectra te voorspellen. Eerder hebben we het gebruik van computationele chemiemethoden onderzocht voor het voorspellen van VUV-spectra (2,3,4). Technieken die bijvoorbeeld de tijdafhankelijke dichtheidsfunctionaaltheorie gebruiken, doen het prima, maar ze produceren niet vaak de fijne spectrale structuur die we kunnen waarnemen in experimentele VUV-spectra in de gasfase. Met behulp van een verscheidenheid aan diepgaande leermethoden hebben we nu goed succes gehad bij het voorspellen van VUV-spectra van chemische structuren, en zelfs vice versa. Dit zou een krachtig hulpmiddel moeten creëren om zowel VUV-detectie voor gaschromatografie te ondersteunen, als een kader te bieden voor ons om ons werk te bevorderen om SFE-SFC te optimaliseren.

We zullen ook een surrogaat-optimalisatietechniek gebruiken om de online extractie- en trappingvariabele te bestuderen en te optimaliseren. Surrogaatoptimalisatie is een methode voor verbeterde responsoppervlakken. Het bevat een breder scala aan functies om complexere responsoppervlakken aan te kunnen. Ons team heeft aan de code gewerkt. Voor dat eerste werk hebben we ons gericht op het modelleren van de elektrospray-respons van verschillende analyten, wat een beetje eenvoudiger en minder instrumentintensief is dan in de SFE-SFC-optimalisatie te springen. Dit bouwt ook voort op eerder gerelateerd onderzoek dat we in het verleden hebben gemeld (5).

Het werken met de studenten en docenten van COSMOS was een geweldige ervaring. Hoewel ik nog lang niet in staat ben om Python te coderen of te decoderen, was het buitengewoon verhelderend om een ​​betere waardering te krijgen voor geavanceerde datawetenschap. De grootste uitdaging bij zo’n samenwerking is communicatie. Omdat we allemaal experts zijn in onze domeinen, vereist het proberen om de kloof te overbruggen discussies die vaak neerkomen op de zeer elementaire grondbeginselen in elk van onze vakgebieden. Maar nu we elkaars taal beter beginnen te spreken, is het potentieel voor vooruitgang in onze beide vakgebieden duidelijk geworden.

Nu sommige studenten van het team afstuderen, zal het interessant zijn om te zien wat voor soort werk ze kunnen vinden. Ik twijfel er niet aan dat analytische chemici met enige datawetenschapsachtergrond zullen worden weggerukt. Ik vraag me meer af over de datawetenschappers met een achtergrond in analytische chemie. Ik heb een vluchtige zoekopdracht uitgevoerd op sommige vacaturesites, maar vond geen overvloed aan kansen. Overweegt bedrijven in de analytische chemie hoe ze een hard-core datawetenschapper kunnen inzetten? Ik zou denken dat dit een behoorlijk actief gebied van werving zou moeten zijn. Ik kan getuigen van het uitzonderlijke niveau van datawetenschapsexpertise waarover deze industriële ingenieurs beschikken bij het verlaten van het COSMOS-programma. Met deze blog wil ik ze promoten bij de analytische chemiegemeenschap. Laat het me weten als u op dit gebied mensen aanwerft, of als u iemand of een bedrijf kent die dat is.

Referenties

  1. AP Wicker, K. Tanaka, M. Nishimura, V Chen, T. Ogura, W. Hedgepeth en KA Schug, Anaal. Chim. Acta, 1127, 282-294 (2020).
  2. KA Schug, De LCGC-blog, nov. 6, 2019. http://www.chromatographyonline.com/lcgc-blog-theoretical-computations-aid-vacuum-ultraviolet-spectroscopic-gas-chromatography-detection
  3. JX Mao, P. Walsh, P. Kroll en KA Schug, toepassing Specificatie 74, 72-80 (2020).
  4. JX Mao, P. Kroll, KA Schug, Structurele Chem. 30, 2217-2224 (2019).
  5. MA Raji en KA Schug, Int. J. Massaspectrum. 279, 100-106 (2009).

Kevin A. Schug is een Full Professor en de Shimadzu Distinguished Professor of Analytical Chemistry in het Department of Chemistry & Biochemistry aan de University of Texas (UT) in Arlington. Hij is ook een partner van Medusa Analytical, LLC. Onderzoek in de Schug-groep aan de UT Arlington omvat fundamentele en toegepaste gebieden van scheidingswetenschap, spectroscopie en massaspectrometrie. Schug werd uitgeroepen tot de LCGC Opkomende leider in chromatografie in 2009 en de 2012 American Chemical Society Division of Analytical Chemistry Young Investigator in Separation Science. Hij is fellow van zowel de UT Arlington als de UT System-Wide Academies of Distinguished Teachers.

Deze blog is een samenwerking tussen LCGC en de American Chemical Society Analytical Division Subdivision on Chromatography and Separations Chemistry (ACS AD SCSC). De doelen van de onderverdeling omvatten:

  • bevordering van chromatografie en scheidingschemie
  • organiseren en sponsoren van symposia over onderwerpen die interessant zijn voor scheidingschemici
  • activiteiten ontwikkelen om de groei van scheidingswetenschap te bevorderen
  • het vergroten van de professionele status en de contacten tussen scheidingswetenschappers.

Ga voor meer informatie over de onderverdeling of om mee te doen naar https://acsanalytical.org/subdivisions/separations/.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert