Voorbeeld 1 Gegevens


TensorFlow-gegevensverzameling

De gegevens die in voorbeeld 1 worden gebruikt, zijn een lijst met auto-objecten zoals deze:

{
  "Name": "chevrolet chevelle malibu",
  "Miles_per_Gallon": 18,
  "Cylinders": 8,
  "Displacement": 307,
  "Horsepower": 130,
  "Weight_in_lbs": 3504,
  "Acceleration": 12,
  "Year": "1970-01-01",
  "Origin": "USA"
},
{
  "Name": "buick skylark 320",
  "Miles_per_Gallon": 15,
  "Cylinders": 8,
  "Displacement": 350,
  "Horsepower": 165,
  "Weight_in_lbs": 3693,
  "Acceleration": 11.5,
  "Year": "1970-01-01",
  "Origin": "USA"
},

De dataset is een JSON-bestand dat is opgeslagen op:

https://storage.googleapis.com/tfjs-tutorials/carsData.json


Gegevens opschonen

Bij de voorbereiding op machine learning is het altijd belangrijk om:

  • Verwijder de gegevens die u niet nodig heeft
  • Reinig de gegevens van fouten

Gegevens verwijderen

Een slimme manier om onnodige gegevens te verwijderen, is om alleen de gegevens te extraheren die u nodig hebt .

Dit kan door uw gegevens te herhalen (loopen) met een kaartfunctie .

De functie hieronder neemt een object en retourneert alleen x en y van de eigenschappen Horsepower en Miles_per_Gallon van het object:

function extractData(obj) {
  return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}

Fouten verwijderen

De meeste datasets bevatten een bepaald type fouten.

Een slimme manier om fouten te verwijderen is om een filterfunctie te gebruiken om de fouten eruit te filteren.

De onderstaande code retourneert false als een van de eigenschappen (x of y) een null-waarde bevat:

function removeErrors(obj) {
  return obj.x != null && obj.y != null;
}

Data ophalen

Wanneer u uw kaart- en filterfuncties gereed hebt, kunt u een functie schrijven om de gegevens op te halen.

async function runTF() {
  const jsonData = await fetch("cardata.json");
  let values = await jsonData.json();
  values = values.map(extractData).filter(removeErrors);
}


De gegevens plotten

Hier is wat code die u kunt gebruiken om de gegevens te plotten:

function tfPlot(values, surface) {
  tfvis.render.scatterplot(surface,
    {values:values, series:['Original','Predicted']},
    {xLabel:'Horsepower', yLabel:'MPG'});
}