For programmatisk at udtrække etiketter fra billeder ved hjælp af Python og Vision API kan du udnytte de kraftfulde funktioner i Google Cloud Vision API. Vision API'en giver et omfattende sæt billedanalysefunktioner, inklusive etiketdetektion, som giver dig mulighed for automatisk at identificere og udtrække etiketter fra billeder.
For at komme i gang skal du konfigurere et Google Cloud-projekt og aktivere Vision API. Når du har gjort det, kan du installere de nødvendige Python-biblioteker ved at køre følgende kommando:
python pip install google-cloud-vision
Dernæst skal du godkende din applikation for at få adgang til Vision API. Du kan gøre dette ved at oprette en tjenestekontonøgle og indstille miljøvariablen `GOOGLE_APPLICATION_CREDENTIALS` til at pege på stien til nøglefilen. Dette kan gøres ved hjælp af følgende kode:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Nu kan du bruge Vision API til programmatisk at udtrække etiketter fra billeder. Følgende kodestykke viser, hvordan du gør dette:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
I denne kode opretter vi først en forekomst af 'ImageAnnotatorClient'-klassen fra 'google.cloud.vision'-biblioteket. Vi læser derefter billedfilen, opretter et "Image"-objekt fra filindholdet og sender det til Vision API'et til etiketdetektering. API-svaret indeholder en liste over etiketannoteringer, hvorfra vi uddrager beskrivelserne af etiketterne.
Du kan nu kalde 'extract_labels'-funktionen ved at videregive stien til den billedfil, du vil analysere. Det vil returnere en liste over etiketter udtrukket fra billedet.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Dette vil udlæse de udtrukne etiketter fra billedet.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API bruger avancerede maskinlæringsmodeller til at analysere billeder og identificere objekter, scener og andre visuelle funktioner. Det kan nøjagtigt registrere en lang række etiketter, hvilket gør det til et værdifuldt værktøj til forskellige applikationer såsom billedklassificering, indholdsmoderering og visuel søgning.
For programmæssigt at udtrække etiketter fra billeder ved hjælp af Python og Vision API skal du konfigurere et Google Cloud-projekt, aktivere Vision API, installere de nødvendige Python-biblioteker, godkende din applikation og derefter bruge Vision API til at udføre etiketdetektion på billeder. De udtrukne etiketter kan bruges til yderligere analyse eller til at øge forståelsen af billedindholdet.
Andre seneste spørgsmål og svar vedr EITC/AI/GVAPI Google Vision API:
- Hvad er nogle foruddefinerede kategorier til objektgenkendelse i Google Vision API?
- Aktiverer Google Vision API ansigtsgenkendelse?
- Hvordan kan den viste tekst tilføjes til billedet, når man tegner objektrammer ved hjælp af "draw_vertices"-funktionen?
- Hvad er parametrene for "draw.line"-metoden i den medfølgende kode, og hvordan bruges de til at tegne linjer mellem topværdier?
- Hvordan kan pudebiblioteket bruges til at tegne objektgrænser i Python?
- Hvad er formålet med "draw_vertices"-funktionen i den medfølgende kode?
- Hvordan kan Google Vision API hjælpe med at forstå former og objekter i et billede?
- Hvordan kan brugere udforske visuelt lignende billeder anbefalet af API'en?
- Hvad er de forskellige elementer, der findes i svarobjektet for Google Vision API's webdetektionsfunktion?
- Hvordan hjælper Web Detection-funktionen med at generere tags til uploadede billeder?
Se flere spørgsmål og svar i EITC/AI/GVAPI Google Vision API