TensorFlow Lite er en letvægtsløsning leveret af TensorFlow til at køre maskinlæringsmodeller på mobile og IoT-enheder. Når TensorFlow Lite-fortolkeren behandler en objektgenkendelsesmodel med en ramme fra et mobilenhedskamera som input, involverer outputtet typisk flere trin for i sidste ende at give forudsigelser vedrørende de objekter, der er til stede i billedet.
For det første føres inputrammen fra mobilenhedens kamera ind i TensorFlow Lite-fortolkeren. Fortolkeren forbehandler derefter inputbilledet ved at konvertere det til et format, der passer til maskinlæringsmodellen. Dette forbehandlingstrin involverer normalt at ændre størrelsen på billedet, så det matcher inputstørrelsen, som modellen forventes, normalisering af pixelværdier og potentielt anvendelse af andre transformationer, der er specifikke for modelarkitekturen.
Dernæst føres det forbehandlede billede gennem objektgenkendelsesmodellen i TensorFlow Lite-fortolkeren. Modellen behandler billedet ved hjælp af dets indlærte parametre og arkitektur til at generere forudsigelser om de objekter, der er til stede i rammen. Disse forudsigelser inkluderer typisk information såsom klassebetegnelserne for de registrerede objekter, deres placeringer i billedet og konfidensscorerne forbundet med hver forudsigelse.
Når modellen har lavet sine forudsigelser, udsender TensorFlow Lite-fortolkeren denne information i et struktureret format, som kan bruges af applikationen, der bruger modellen. Dette output kan variere afhængigt af de specifikke krav til applikationen, men inkluderer almindeligvis de detekterede objektklasser, afgrænsningsfelter, der angiver objekterne i billedet, og de tilhørende konfidensscore.
For eksempel, hvis objektgenkendelsesmodellen er trænet til at detektere almindelige objekter som biler, fodgængere og trafikskilte, kan outputtet fra TensorFlow Lite-fortolkeren inkludere forudsigelser såsom "bil" med en afgrænsningsboks, der angiver bilens placering i billede og en konfidensscore, der indikerer modellens sikkerhed omkring forudsigelsen.
Outputtet fra TensorFlow Lite-fortolkeren til en maskinindlæringsmodel for objektgenkendelse, der behandler en ramme fra et mobilenhedskamera, involverer forbehandling af inputbilledet, føring af det gennem modellen til slutning og forudsigelser om de objekter, der er til stede i billedet i et struktureret format egnet til videre behandling af ansøgningen.
Andre seneste spørgsmål og svar vedr EITC/AI/TFF TensorFlow Fundamentals:
- Hvordan kan man bruge et indlejringslag til automatisk at tildele korrekte akser til et plot af repræsentation af ord som vektorer?
- Hvad er formålet med maksimal pooling i et CNN?
- Hvordan anvendes funktionsudtrækningsprocessen i et konvolutionelt neuralt netværk (CNN) til billedgenkendelse?
- Er det nødvendigt at bruge en asynkron indlæringsfunktion til maskinlæringsmodeller, der kører i TensorFlow.js?
- Hvad er TensorFlow Keras Tokenizer API's maksimale antal ord parameter?
- Kan TensorFlow Keras Tokenizer API bruges til at finde de mest hyppige ord?
- Hvad er TOCO?
- Hvad er forholdet mellem et antal epoker i en maskinlæringsmodel og nøjagtigheden af forudsigelse ved at køre modellen?
- Producerer pakkens nabo-API i Neural Structured Learning af TensorFlow et udvidet træningsdatasæt baseret på naturlige grafdata?
- Hvad er pack neighbours API i Neural Structured Learning af TensorFlow?
Se flere spørgsmål og svar i EITC/AI/TFF TensorFlow Fundamentals