Når du bruger en Google-model og træner den på din egen instans, afhænger spørgsmålet om, hvorvidt Google beholder forbedringerne fra dine træningsdata, af flere faktorer, herunder den specifikke Google-tjeneste eller det specifikke Google-værktøj, du bruger, og de servicevilkår, der er knyttet til det pågældende værktøj. I forbindelse med Google Clouds maskinlæringstjenester kræver forståelsen af, hvordan data håndteres, et nærmere kig på den underliggende arkitektur og de politikker, der styrer databeskyttelse og -brug.
Google Cloud tilbyder en række maskinlæringstjenester og værktøjer, såsom Google Cloud AI Platform, TensorFlow og AutoML, hver med sit eget sæt funktioner og muligheder. Når du træner en model ved hjælp af disse tjenester, er der vigtige overvejelser vedrørende databeskyttelse og modelopdateringer.
1. Dataejerskab og privatliv: Google Clouds servicevilkår foreskriver generelt, at kunder bevarer ejerskabet af deres data. Det betyder, at alle data, du bruger til at træne en model på Google Cloud, forbliver din ejendom. Google er forpligtet til at beskytte privatlivets fred og fortroligheden af kundedata, og dets cloud-tjenester er designet til at sikre overholdelse af forskellige databeskyttelsesforskrifter, såsom GDPR.
2. Modeltræning og forbedringer: Når du træner en maskinlæringsmodel ved hjælp af Google Cloud-tjenester, deles de forbedringer eller opdateringer, der er foretaget til modellen som følge af dine træningsdata, typisk ikke med Google, medmindre andet er udtrykkeligt angivet. Den trænede model og eventuelle forbedringer som følge af dine data forbliver inden for din kontrol og er ikke automatisk inkorporeret i Googles globale modeller.
3. Federeret læring: I nogle scenarier anvender Google teknikker som fødereret læring, hvor modelforbedringer samles fra flere kilder uden at dele de underliggende data. I sådanne tilfælde sendes kun modelopdateringer tilbage til en central server, og individuelle datapunkter deles ikke. Dette er dog en specifik tilgang og gælder ikke universelt på tværs af alle Google Cloud maskinlæringstjenester.
4. Servicespecifikke politikker: Det er vigtigt at gennemgå de specifikke vilkår og betingelser, der er knyttet til den Google Cloud-tjeneste, du bruger. Nogle tjenester kan tilbyde muligheder for at bidrage til en fælles model eller drage fordel af kollektive forbedringer, men disse vil kræve udtrykkeligt samtykke og deltagelse.
5. Praktisk eksempel: Overvej et scenario, hvor du bruger Google AI Platform til at træne en tilpasset billedgenkendelsesmodel til din virksomhed. Du uploader dit datasæt, træner modellen og opnår forbedret nøjagtighed. I henhold til Google Clouds standardpraksis bevares forbedringerne af din model i dit projekt, og Google har ikke adgang til eller bruger disse forbedringer til sine egne formål. Din trænede model forbliver isoleret fra Googles forudtrænede modeller, medmindre du vælger at dele den gennem en specifik funktion eller et specifikt program, der involverer samarbejde.
Når du træner en Google-model på din egen instans, bevares forbedringerne fra dine træningsdata generelt i dit miljø og deles ikke med Google, medmindre der er en specifik aftale eller funktion, der letter sådan deling. Det er vigtigt at forstå servicevilkårene og datahåndteringspolitikkerne for den specifikke Google Cloud-tjeneste, du bruger.
Andre seneste spørgsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:
- Kan mere end én model anvendes under maskinlæringsprocessen?
- Kan maskinlæring tilpasse, hvilken algoritme der skal bruges, afhængigt af et scenarie?
- Hvad er den enkleste vej til den mest grundlæggende didaktiske AI-modeltræning og implementering på Google AI Platform ved hjælp af et gratis niveau/prøveversion med en GUI-konsol trin for trin for en absolut nybegynder uden programmeringsbaggrund?
- Hvordan træner og implementerer man en simpel AI-model i Google Cloud AI Platform via GCP-konsollens grafiske brugergrænseflade i en trin-for-trin-vejledning?
- Hvad er den enkleste trinvise procedure til at øve sig i distribueret AI-modeltræning i Google Cloud?
- Hvad er den første model, man kan arbejde med, med nogle praktiske forslag til at begynde med?
- Er algoritmerne og forudsigelserne baseret på input fra den menneskelige side?
- Hvad er de vigtigste krav og de enkleste metoder til at oprette en model for naturlig sprogbehandling? Hvordan kan man oprette en sådan model ved hjælp af tilgængelige værktøjer?
- Kræver brugen af disse værktøjer et månedligt eller årligt abonnement, eller er der en vis mængde gratis brug?
- Hvad er en epoke i forbindelse med træningsmodelparametre?
Se flere spørgsmål og svar i EITC/AI/GCML Google Cloud Machine Learning