Toepassingsgebieden van Deep Learning - Wetenschap en bedrijfsleven

Zoals in het vorige bericht werd aangetoond, is machine learning geweldig voor patroonherkenning. Maar het wordt zo krachtig dat het op veel meer gebieden kan worden gebruikt dan alleen patroonherkenning, zoals:

  • Ontdekking van geneesmiddelen en toxicologie
    Het ontdekken van nieuwe behandelingen voor menselijke ziekten is een van de meest ingewikkelde taken die er bestaan. Het duurt jaren om een nieuwe verbinding te onderzoeken en te testen en het kan nooit de markt bereiken. Deze mislukkingen van chemische verbindingen worden veroorzaakt door onvoldoende efficiëntie, onopgemerkte interacties met andere verbindingen of toch toxische effecten. Traditioneel wordt bij virtuele drug screening alleen gebruik gemaakt van de experimentele gegevens van de specifieke ziekte die wordt bestudeerd. Naarmate het volume van experimentele screeninggegevens over vele ziekten blijft toenemen, hebben verschillende onderzoeksgroepen echter aangetoond dat gegevens van meerdere ziekten kunnen worden benut met multitask neurale netwerken om de doeltreffendheid van virtuele screening te verbeteren. In 2012 won een team onder leiding van George Dahl de "Merck Molecular Activity Challenge" met behulp van multi-task diepe neurale netwerken om het biomoleculaire doelwit van een verbinding te voorspellen met een gemiddelde oppervlakte onder de curve (AUC) van 0,938.
    Diepe neurale netwerken werden ook toegepast bij de voorspelling van toxiciteit omdat zij automatisch complexe kenmerken construeren en multi-task leren mogelijk maken. In 2014 gebruikte de groep van Sepp Hochreiter Deep Learning multitask neurale netwerken om off-target en toxische effecten van milieuchemicaliën in voedingsstoffen, huishoudelijke producten en geneesmiddelen te detecteren en won de "Tox21 Data Challenge" van NIH, FDA en NCATS met een area under the curve (AUC) gemiddelde prestatie van 0,846.
    In 2015 werd AtomNet geboren, het eerste op structuur gebaseerde diepe convolutionaire neurale netwerk, ontworpen om de bio-activiteit van kleine moleculen te voorspellen voor toepassingen bij de ontdekking van geneesmiddelen, met een AUC van meer dan 0,9 voor 57,8% van de doelen in de DUDE-benchmark. AtomNet heeft al vragen onderzocht op het gebied van kanker, neurologische ziekten, antivirale middelen, antiparasitica en antibiotica. De door AtomNet voorspelde moleculen zijn de belangrijkste kandidaten in onderzoeksprogramma's geworden.

 

  • Bio-informatica
    Bio-informatica is een vakgebied dat verantwoordelijk is voor de ontwikkeling van methodologie en software-instrumenten voor toepassing in biologische gegevens. Deep learning heeft vele toepassingen in de bio-informatica, het kan helpen bij het voorspellen van aminozuursequenties, RNA splicing of genontologie, enz.
    DNdisorder is een systeem dat DNN's gebruikt om eiwitwanorde te voorspellen, waarbij beperkte Boltzmann-machines worden gebruikt als middel om de gewichten te initialiseren en vervolgens te verfijnen met behulp van een back propagation procedure. Dit systeem heeft een AUC van 0,8299.

 

  • Aanbevelingssystemen
    Een aanbevelingssysteem is een systeem dat de reacties van gebruikers op opties voorspelt. Er zijn verschillende soorten aanbevelingssystemen:
    Op inhoud gebaseerde systemen, die eigenschappen van de aanbevolen items onderzoeken. Als een Netflix-gebruiker bijvoorbeeld veel cowboyfilms heeft bekeken, beveelt hij een film aan die in de database is ingedeeld als "cowboy"-genre.
    Collaboratieve filtersystemen, die items aanbevelen op basis van overeenkomsten tussen gebruikers en/of items. De aan een gebruiker aanbevolen items zijn die waaraan soortgelijke gebruikers de voorkeur geven.
    Hybride aanbevelingssystemen, die gebruik maken van een combinatie van op inhoud gebaseerde en collaboratieve filtersystemen. Netflix gebruikt hybride aanbevelingssystemen. Zij doen aanbevelingen door de kijk- en zoekgewoonten van vergelijkbare gebruikers te vergelijken (collaboratieve filtering), maar ook door films aan te bieden die kenmerken delen met films die een gebruiker hoog heeft ingeschat (inhoudsgebaseerde filtering).
    Met behulp van DNN's kunnen deze systemen de voorkeuren van gebruikers leren en nieuwe inhoud aanbevelen op basis van keuzes uit het verleden.
    Spotify, bijvoorbeeld, heeft projecten waarbij convolutionele en recurrente NN's met collaboratieve filtering worden gebruikt om de volgende artiest, het volgende album of het volgende nummer te voorspellen, op basis van de geschiedenis van de streams.

 

Fig.1. Collaboratief filteren

(De paarse gebruiker keek naar de films A, B en C. En omdat de blauwe gebruiker de films A en B zag, beveelt het systeem de C aan)

 

  • Beheer van klantenrelaties
    Customer relationship management (CRM) is een strategie om de interactie tussen de onderneming en de klanten te beheren. CRM analyseert gegevens over de geschiedenis van klanten met een onderneming om de zakelijke relaties met klanten te verbeteren, waarbij de nadruk ligt op het behouden van klanten om de verkoop te stimuleren. Datamining biedt de technologie om grote hoeveelheden gegevens te analyseren en verborgen patronen in gegevens op te sporen om ruwe gegevens om te zetten in waardevolle informatie. Het gebruik van DNN's zal helpen het toekomstige gedrag van klanten te voorspellen en aanbevelingen te doen om de klantrelatie te verbeteren. Er zijn enkele studies die deze aanpak suggereren.

 
Referenties

  1. Google, http://googleresearch.blogspot.pt/2015/03/large-scale-machine-learning-for-drug.html
  2. Ramsundar, B., Kearnes, S., Riley, P., Webster, D., Konerding, D., Pande, V.: Massively Multitask Networks for Drug Discovery. arXiv:1502.02072v1 (2015)
  3. Wallach, I., Dzamba, M., Heifets, A.: AtomNet: A Deep Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery. arXiv:1510.02855v1 (2015)

Laat een reactie achter

Je e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *