Python -zelfstudie

Python HOME Python-intro Python Aan de slag Python-syntaxis Python-opmerkingen Python-variabelen Python-gegevenstypen Python-nummers Python-casting Python-snaren Python Booleans Python-operators Python-lijsten Python-tupels Python-sets Python-woordenboeken Python Als...Anders Python While-lussen Python voor lussen Python-functies Python Lambda Python-arrays Python-klassen/objecten Python-overerving Python-iterators Python-bereik Python-modules Python-datums Python-wiskunde Python JSON Python RegEx Python PIP Python proberen...Behalve Python-gebruikersinvoer Opmaak van Python-tekenreeksen

Bestandsbehandeling

Python-bestandsafhandeling Python-bestanden lezen Python bestanden schrijven/maken Python bestanden verwijderen

Python-modules

NumPy-zelfstudie Panda walkthrough Scipy-zelfstudie

Python Matplotlib

Matplotlib Intro Matplotlib Aan de slag Matplotlib Pyplot Matplotlib plotten Matplotlib-markeringen Matplotlib-lijn Matplotlib-labels Matplotlib-raster Matplotlib-subplots Matplotlib Scatter Matplotlib-repen Matplotlib-histogrammen Matplotlib-cirkeldiagrammen

Machinaal leren

Beginnen Gemiddelde mediane modus Standaardafwijking percentiel Gegevensdistributie Normale gegevensverdeling Spreidingsplot Lineaire regressie Polynomiale regressie Meervoudige regressie Schaal Trein/Test Beslissingsboom

Python MySQL

MySQL Aan de slag MySQL Database maken MySQL-tabel maken MySQL-invoeging MySQL Select MySQL Waar MySQL Bestel op MySQL verwijderen MySQL-droptabel MySQL-update MySQL-limiet MySQL Join

Python MongoDB

MongoDB Aan de slag MongoDB Database maken MongoDB Verzameling maken MongoDB invoegen MongoDB Zoeken MongoDB-query MongoDB Sorteren MongoDB verwijderen MongoDB Drop-collectie MongoDB-update MongoDB-limiet

Python-referentie

Python-overzicht Ingebouwde functies van Python Python-stringmethoden Methoden voor Python-lijst Python-woordenboekmethoden Python Tuple-methoden Methoden voor Python-sets Python-bestandsmethoden Python-trefwoorden Python-uitzonderingen Python-woordenlijst

Modulereferentie

Willekeurige module Verzoekmodule Statistiekmodule Wiskundige module cMath-module

Python-instructies

Lijstduplicaten verwijderen Een string omkeren Voeg twee nummers toe

Python-voorbeelden

Python-voorbeelden Python-compiler Python-oefeningen Python-quiz Python-certificaat

Machinaal leren

Machine Learning is de computer laten leren door data en statistieken te bestuderen.

Machine Learning is een stap in de richting van kunstmatige intelligentie (AI).

Machine Learning is een programma dat data analyseert en leert de uitkomst te voorspellen.

Waar te beginnen?

In deze tutorial gaan we terug naar wiskunde en studiestatistieken, en hoe je belangrijke getallen kunt berekenen op basis van datasets.

We zullen ook leren hoe we verschillende Python-modules kunnen gebruiken om de antwoorden te krijgen die we nodig hebben.

En we zullen leren hoe we functies kunnen maken die de uitkomst kunnen voorspellen op basis van wat we hebben geleerd.


Gegevensset

In de geest van een computer is een dataset elke verzameling gegevens. Het kan van alles zijn, van een array tot een complete database.

Voorbeeld van een array:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Voorbeeld van een databank:

CarnameKleurLeeftijdSnelheidAutoPass
BMWrood599ja
Volvozwart786ja
VWgrijs887N
VWwit788ja
Fordwit2111ja
VWwit1786ja
Teslarood2103ja
BMWzwart987ja
Volvogrijs494N
Fordwit1178N
Toyotagrijs1277N
VWwit985N
Toyotablauw686ja

Door naar de array te kijken, kunnen we raden dat de gemiddelde waarde waarschijnlijk rond de 80 of 90 ligt, en we kunnen ook de hoogste waarde en de laagste waarde bepalen, maar wat kunnen we nog meer doen?

En door naar de database te kijken, kunnen we zien dat de meest populaire kleur wit is en dat de oudste auto 17 jaar is, maar wat als we konden voorspellen of een auto een AutoPass had, alleen door naar de andere waarden te kijken?

Daar is Machine Learning voor! Gegevens analyseren en de uitkomst voorspellen!

Bij Machine Learning is het gebruikelijk om met zeer grote datasets te werken. In deze tutorial zullen we proberen het zo gemakkelijk mogelijk te maken om de verschillende concepten van machine learning te begrijpen, en we zullen werken met kleine, gemakkelijk te begrijpen datasets.


Gegevenstypen

Om data te analyseren is het belangrijk om te weten met wat voor soort data we te maken hebben.

We kunnen de datatypes opsplitsen in drie hoofdcategorieën:

  • Numeriek
  • categorisch
  • ordinaal

Numerieke gegevens zijn getallen en kunnen worden opgesplitst in twee numerieke categorieën:

  • Discrete gegevens
    - getallen die beperkt zijn tot gehele getallen. Voorbeeld: Het aantal passerende auto's.
  • Continue gegevens
    - getallen die van oneindige waarde zijn. Voorbeeld: de prijs van een artikel of de grootte van een artikel

Categorische gegevens zijn waarden die niet tegen elkaar kunnen worden afgewogen. Voorbeeld: een kleurwaarde, of eventuele ja/nee-waarden.

Ordinale gegevens zijn als categorische gegevens, maar kunnen tegen elkaar worden afgemeten. Voorbeeld: schoolcijfers waar A beter is dan B enzovoort.

Door het gegevenstype van uw gegevensbron te kennen, weet u welke techniek u moet gebruiken bij het analyseren ervan.

In de volgende hoofdstukken leert u meer over statistiek en het analyseren van gegevens.