Fashion-MNIST-datasættet og det klassiske MNIST-datasæt er to populære datasæt, der bruges inden for maskinlæring til billedklassificeringsopgaver. Mens begge datasæt består af gråtonebilleder og almindeligvis bruges til benchmarking og evaluering af maskinlæringsalgoritmer, er der flere vigtige forskelle mellem dem.
For det første indeholder det klassiske MNIST-datasæt billeder af håndskrevne cifre (0-9) taget fra NIST Special Database 3 og NIST Special Database 1. Billederne i dette datasæt er 28×28 pixels store og har en enkelt kanal (gråtoner). Datasættet består af 60,000 træningsbilleder og 10,000 testbilleder, hvilket giver i alt 70,000 billeder. Hvert billede er mærket med det tilsvarende ciffer, det repræsenterer, fra 0 til 9.
På den anden side er Fashion-MNIST-datasættet designet til at være en drop-in-erstatning for det klassiske MNIST-datasæt, men med fokus på modeprodukter. Det består af 60,000 træningsbilleder og 10,000 testbilleder, ligesom det klassiske MNIST-datasæt. Men i stedet for håndskrevne cifre indeholder Fashion-MNIST-datasættet billeder af modeprodukter såsom tøj, sko og tilbehør. Disse billeder er også 28×28 pixels store og har en enkelt kanal (gråtoner). Hvert billede i Fashion-MNIST-datasættet er mærket med en af følgende kategorier: T-shirt/top, bukser, pullover, kjole, frakke, sandal, skjorte, sneaker, taske og ankelstøvle.
Hovedmotivationen bag oprettelsen af Fashion-MNIST-datasættet var at levere et mere udfordrende og realistisk datasæt til billedklassificeringsopgaver. Mens det klassiske MNIST-datasæt er blevet grundigt undersøgt, og mange maskinlæringsalgoritmer opnår høj nøjagtighed på det, bliver det ofte kritiseret for at være for nemt og ikke repræsentativt for scenarier i den virkelige verden. Ved at introducere Fashion-MNIST-datasættet har forskere og praktikere et mere mangfoldigt og komplekst datasæt at arbejde med, hvilket gør dem i stand til at udvikle og evaluere algoritmer, der er mere robuste og anvendelige til problemer i den virkelige verden.
Anvendelsesmæssigt bruges det klassiske MNIST-datasæt ofte som udgangspunkt for begyndere inden for maskinlæring. Dens enkelhed og lille størrelse gør den ideel til at lære det grundlæggende i billedklassificeringsalgoritmer og evaluere deres ydeevne. Til gengæld er Fashion-MNIST-datasættet velegnet til mere avancerede opgaver, hvor målet er at klassificere modeprodukter præcist. Dette datasæt kan bruges til at træne maskinlæringsmodeller til forskellige applikationer, såsom modeanbefalingssystemer, virtuel prøve-på og billedbaseret søgning i e-handel.
Fashion-MNIST-datasættet og det klassiske MNIST-datasæt er to meget anvendte datasæt inden for maskinlæring til billedklassificeringsopgaver. Mens det klassiske MNIST-datasæt består af håndskrevne cifre, indeholder Fashion-MNIST-datasættet billeder af modeprodukter. Fashion-MNIST-datasættet giver et mere udfordrende og realistisk datasæt til evaluering af maskinlæringsalgoritmer i forbindelse med mode. Begge datasæt har deres egne applikationer og kan bruges til at træne og evaluere maskinlæringsmodeller til forskellige billedklassificeringsopgaver.
Andre seneste spørgsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:
- Når man renser dataene, hvordan kan man så sikre sig at dataene ikke er partiske?
- Hvordan hjælper maskinlæring kunder med at købe tjenester og produkter?
- Hvorfor er maskinlæring vigtig?
- Hvad er de forskellige typer maskinlæring?
- Skal separate data bruges i de efterfølgende trin i træningen af en maskinlæringsmodel?
- Hvad er meningen med begrebet serverløs forudsigelse i skala?
- Hvad vil der ske, hvis testprøven er 90 %, mens evaluering eller prædiktiv prøve er 10 %?
- Hvad er en evalueringsmetrik?
- Hvad er algoritmens hyperparametre?
- Hvordan opsummerer man bedst, hvad TensorFlow er?
Se flere spørgsmål og svar i EITC/AI/GCML Google Cloud Machine Learning