Waarom kan een neuraal netwerk veel beter zijn dan een mens?
Een mens overziet hooguit enkele relevante aspecten en de verbanden daartussen. Maar als de informatie teveel wordt, als het aantal details dat van invloed is op de uitkomst te groot wordt, dan is een mens niet meer in staat al die informatie te overzien, laat staan op een logische wijze te wegen en te verwerken.
Een computer wel; die rekent door wegingen aan al die gegevens te geven. Ongeacht de hoeveelheid data (het rekenen duurt hooguit wat langer) wordt alles meegewogen en meegeteld in de uiteindelijke uitkomst c.q. aanbeveling die de computer doet.
Die rekenkracht maakt dat de computer het overzicht houdt en via logische verbanden logische conclusies trekt uit een brei van gegevens die voor een mens onmogelijk te overzien is.
Hoe wordt een neuraal netwerk gebouwd?
Eerst worden heel veel relevante data verzameld. Alles dat maar even van invloed zou kunnen zijn op de antwoorden die je zoekt, wordt in een Excel-sheet gezet. Inclusief de antwoorden (= historische informatie).
Met al die informatie gaan onze statistici aan de slag.
Er vindt voorbehandeling en data-analyse plaats: denk aan uitsplitsen, volgorde bepalingen, uitschieters behandelen en wegingen aanbrengen. Verbanden worden onderzocht en zelfs wordt algemene informatie toegevoegd (voorbeeld: als de lengte van mannen relevant lijkt en al beschikbaar is in het systeem, dan kan het toevoegen van gemiddelde lengtes van mannen per streek of land betere uitkomsten opleveren).
Dan worden de data in twee willekeurige stukken verdeeld.
Er wordt uitgezocht welk type neuraal netwerk het beste past, welke leeralgoritmes en welk leertempo. Per regel, batch of database. Welke omvang. Al dit soort punten wordt geoptimaliseerd.
Met het eerste deel van de data – het testgedeelte – worden heel veel testen uitgevoerd. Er wordt bepaald welke informatie relevant is en welke niet en met die eerste dataset wordt gefine tuned welke wegingen moeten worden meegegeven. Dat bepaalt c.q. leert het neurale netwerk grotendeels zelf in vele iteraties (herhalingen) van testsessies met de testdata: dat is het trainen van het netwerk.
Op ieder moment kan de statisticus het in aanbouw zijnde neurale netwerk ‘loslaten’ op de data van de tweede set, die als controledataset fungeert. Zo wordt bepaald hoe goed het neurale netwerk al presteert.
Uiteraard is dit een sterk vereenvoudigde weergave van wat er in de praktijk nodig is om een neuraal netwerk te bouwen.
Wat voor gegevens moet ik aanleveren?
Daarover overleggen we vooraf. Samen met u kijken we welke informatie voorhanden is en of het nodig is dat u andersoortige informatie gaat verzamelen.
Het gaat om zoveel mogelijk data die van invloed kan zijn op de antwoorden die we zoeken. Die data kan altijd geanonimiseerd aan ons worden verstrekt, zodat privacy-issues nooit aan de orde zijn.
Hoeveel gegevens moet ik aanleveren?
We maken een onderscheid tussen enerzijds het aantal soorten informatie (bijvoorbeeld: hebben we geboortedatums nodig en de duur van telefoongesprekken?) en anderzijds hoe vaak die informatie voorkomt in de dataset (bijvoorbeeld: hoeveel geboortedatums hebben we beschikbaar?). De vuistregel is voor beide type informatie: hoe meer hoe beter.
Wij bepalen tijdens de bouw van het neurale netwerk en het testen ervan welke data we het beste kunnen gebruiken en welke minder of niet relevant blijken.
Hoe moet ik de gegevens aanleveren?
In een Excel-bestand met kolomkoppen in de eerste regel.
Die kolomkoppen zijn de variabelen die mogelijk verband houden met het antwoord dat we zoeken.
En een kolom met de bijbehorende vastgestelde resultaten / antwoorden uit het verleden.
Wij weigeren informatie in ontvangst te nemen die herleidbaar is tot personen of adressen. Dus bijvoorbeeld geen huis-, bankrekening- en telefoonnummers noch e-mailadressen.
Wel is een unieke ID (identificatienummer) per regel handig, om vragen op regelniveau te kunnen stellen.
Voeg ook de contactpersoon en zijn of haar e-mailadres en telefoonnummer toe aan de dataset voor als wij vragen over de data hebben.
LET OP: U houdt ongeveer 10% van de data achter. Deze dataset dient random en een representatieve steekproef van de totale data te zijn. Met deze dataset kunnen we dan samen met u tijdens de oplevering onafhankelijk vaststellen hoe nauwkeurig het gebouwde neurale netwerk is.
Wat kost een neuraal netwerk en hoe lang duurt het bouwen ervan?
Dat is erg wisselend en hangt af van diverse factoren. Daarom is een neuraal netwerk altijd maatwerk.
Wij spreken altijd vooraf uitgebreid de wensen van de klant door en wij kijken welke informatie hoe beschikbaar is. Op basis daarvan maken wij een goede inschatting van de benodigde tijd.
De offerte zal daardoor nooit financiële onzekerheden bevatten: wij bieden tegen vooraf vaststaande prijzen onze diensten aan, desgewenst en indien mogelijk op basis van no-cure-no-pay.
Wat erg kan helpen de benodigde tijd en dus de prijs te drukken, dat is de juiste en volledige aanlevering van de benodigde data conform de door ons daarvoor opgestelde richtlijnen (zie elders).
Levert u ook op basis van 'no cure no pay'?
Wij zijn zo overtuigd van de kracht van onze goed getrainde neurale netwerken en van onze inschattingen vooraf, dat wij in veel gevallen een voorstel op basis van ‘no cure no pay’ kunnen doen.
We maken dan vooraf een contractje op, waarin afspraken staan over welke informatie u aanlevert en hoe. En voor welke prijs u het netwerk afneemt als het neurale netwerk presteert boven de drempel die we vooraf samen overeenkomen.
U loopt dan geen enkel risico, want u hoeft alleen te betalen als het netwerk besparingen gaat opleveren die u vooraf kent en voldoende acht.
Hoe groot kan het voordeel c.q. de besparing zijn?
Dat hangt af van diverse factoren en is voor iedere situatie anders.
Maar denkt u zich eens in, dat u informatie heeft die niemand anders heeft en die u zonder het neurale netwerk ook niet had kunnen hebben. In zijn algemeenheid is zo’n informatievoorsprong in te zetten om betere beslissingen te nemen en dat heeft vaak tot gevolg dat minder geld hoeft te worden uitgegeven c.q. dat er wordt bespaard. En dat gaat vaak om grote besparingen. Wij denken graag met u mee over de mogelijkheden.
Kijkt u elders op onze website voor diverse praktijkvoorbeelden.
Hoe vindt de acceptatie plaats?
De klant heeft 10% van de oorspronkelijke data achtergehouden (een random maar representatieve steekproef), inclusief bijbehorende uitkomsten.
Samen met de klant laten we het op te leveren neurale netwerk de uitkomst voorspellen van deze 10%.
Deze resultaten zetten we af tegen de daadwerkelijke uitkomsten.
Als de nauwkeurigheid binnen de afgesproken marges valt, wordt het netwerk in gebruik genomen.
Hoe wordt het netwerk geïmplementeerd?
Dat hangt af van de situatie bij de klant.
Het getrainde neurale netwerk slaan wij op in een DLL.
Wij kunnen een stand alone Excel-oplossing leveren, maar ook een integratie in uw IT-omgeving aanbieden: met C#, C++ of Visual Basic kan de DLL worden gebruikt.