Σε μια εποχή που έχει γίνει Είναι δύσκολο να διακρίνει κανείς μια πραγματική φωτογραφία από μια φωτογραφία που δημιουργήθηκε με τεχνητή νοημοσύνη.Η Google αποφάσισε να πάει τον βοηθό Gemini ένα βήμα παραπέρα. Η εφαρμογή περιλαμβάνει πλέον μια λειτουργία που σας επιτρέπει να ελέγχετε εάν μια εικόνα έχει υποστεί επεξεργασία από τα μοντέλα τεχνητής νοημοσύνης της εταιρείας, κάτι ιδιαίτερα σημαντικό για χρήστες στην Ισπανία και την Ευρώπη που θέλουν να μάθουν τι κρύβεται πίσω από τις εικόνες που λαμβάνουν μέσω των μέσων κοινωνικής δικτύωσης, των εφαρμογών ανταλλαγής μηνυμάτων ή του email.
Αυτό το νέο χαρακτηριστικό σημαίνει ότι, με Ανεβάστε μια εικόνα στην εφαρμογή Gemini και κάντε μια απλή ερώτηση Για παράδειγμα, αν κάνετε ερωτήσεις όπως «Δημιουργήθηκε με την Τεχνητή Νοημοσύνη της Google;» ή «Είναι δημιουργημένη από την Τεχνητή Νοημοσύνη;», ο βοηθός αναλύει τη φωτογραφία και απαντά με το αν δημιουργήθηκε ή επεξεργάστηκε χρησιμοποιώντας τα συστήματα της Google. Επιπλέον, δεν παρέχει απλώς μια απάντηση ναι ή όχι: συνοδεύει την απάντηση με πρόσθετο πλαίσιο σχετικά με το περιεχόμενο, βοηθώντας στην καλύτερη αξιολόγηση της προέλευσής του.
Πώς επαληθεύει η Gemini εάν μια εικόνα δημιουργήθηκε με την τεχνητή νοημοσύνη της Google

Ο πυρήνας αυτού του συστήματος είναι SynthID, η τεχνολογία αόρατου υδατογραφήματος που παρουσίασε η Google πριν από δύο χρόνιαΑυτό το εργαλείο εισάγει ένα ψηφιακό σήμα απευθείας στα pixel των εικόνων που δημιουργούνται ή επεξεργάζονται με τα μοντέλα τεχνητής νοημοσύνης του, χωρίς καμία ορατή αλλαγή. Το υδατογράφημα παραμένει ακόμα και όταν η φωτογραφία έχει περικοπεί, συμπιεστεί ή έχουν εφαρμοστεί φίλτρα, κάτι που είναι συνηθισμένο κατά την κοινοποίηση μέσω εφαρμογών ανταλλαγής μηνυμάτων ή μέσων κοινωνικής δικτύωσης.
Όταν ο χρήστης ανεβάζει μια φωτογραφία στην εφαρμογή και κάνει την ερώτηση, Ο Gemini εξετάζει την εικόνα αναζητώντας το υδατογράφημα SynthIDΕάν εντοπίσει την εικόνα, υποδεικνύει ότι η φωτογραφία «δημιουργήθηκε ή επεξεργάστηκε από την τεχνητή νοημοσύνη της Google» και προσθέτει συμπληρωματικές πληροφορίες, όπως το πλαίσιο σχετικά με τον τύπο περιεχομένου και πού έχει εμφανιστεί κάτι παρόμοιο στον ιστό. Εάν δεν εντοπίσει την επωνυμία, διευκρινίζει ότι η εικόνα δεν φαίνεται να έχει δημιουργηθεί χρησιμοποιώντας μοντέλα της Google, αν και αφήνει ανοιχτό το ενδεχόμενο να προέρχεται από άλλα εργαλεία τεχνητής νοημοσύνης.
Αυτός ο τύπος επαλήθευσης είναι ιδιαίτερα χρήσιμος σε καθημερινές καταστάσεις στις οποίες λαμβάνονται πολύ ρεαλιστικές εικόνεςΑπό υποτιθέμενες πρόσφατες φωτογραφίες που κοινοποιούνται σε ομάδες του WhatsApp μέχρι διαφημίσεις ή δημιουργικό περιεχόμενο στα μέσα κοινωνικής δικτύωσης, αντί να βασίζεται αποκλειστικά στο ανθρώπινο μάτι, ο χρήστης μπορεί να χρησιμοποιήσει έναν τεχνικό δείκτη ενσωματωμένο στην ίδια την εικόνα.
Η Google ισχυρίζεται ότι το SynthID έχει ήδη εφαρμοστεί σε δισεκατομμύρια κομμάτια περιεχομένου που δημιουργούνται από τα μοντέλα τους, συμπεριλαμβανομένων εκείνων που παράγουν συστήματα όπως Nano Banana Pro (το μοντέλο δημιουργίας εικόνων που σχετίζεται με το Gemini), το οποίο δίνει μια ιδέα για το εύρος που μπορεί να έχει αυτή η επαλήθευση στο οικοσύστημα της εταιρείας.
Μαζί με το αόρατο υδατογράφημα, η Google διατηρεί επίσης μια ορατή επωνυμία σε πολλές από τις δημιουργημένες εικόνες Για τους χρήστες των δωρεάν προγραμμάτων και του Google AI Pro, υπάρχει ένα είδος «λάμψης» στο Gemini που λειτουργεί ως σαφής προειδοποίηση για τον μέσο χρήστη. Σε επαγγελματικά περιβάλλοντα, ωστόσο, αυτό το ορατό σημάδι μπορεί να απενεργοποιηθεί για να παρέχει έναν καθαρό καμβά, επομένως η επαλήθευση βασίζεται στο SynthID και τα μεταδεδομένα.
Βήμα προς βήμα: πώς να χρησιμοποιήσετε την επαλήθευση εικόνας στην εφαρμογή Gemini

Η διαδικασία έχει σχεδιαστεί έτσι ώστε Οποιοσδήποτε διαθέτει κινητό τηλέφωνο Android ή iOS μπορεί να το χρησιμοποιήσει χωρίς τεχνικές επιπλοκές.Δεν χρειάζεται να είστε ειδικός στην επεξεργασία ή την παραγωγική τεχνητή νοημοσύνη, απλώς πρέπει να ξέρετε συμβουλές για τη συγγραφή καλών προτάσεων Μπορεί να βοηθήσει και απλά πρέπει να ακολουθήσετε μερικά βήματα από την ίδια την εφαρμογή Gemini.
Αρχικά, ανοίξτε την εφαρμογή και πατήστε το κουμπί προσθήκης αρχείου, το οποίο συνήθως εμφανίζεται στο κάτω μέρος της οθόνης με ένα εικονίδιο "+". Από εκεί, μπορείτε να επιλέξετε την εικόνα από το συλλογή κινητών, φάκελος αρχείων ή υπηρεσίες όπως το Google DriveΜόλις ανεβάσει η φωτογραφία, εισάγεται μια ερώτηση όπως "Δημιουργήθηκε ή επεξεργάστηκε αυτή η εικόνα από την Τεχνητή Νοημοσύνη;" ή "Δημιουργήθηκε από την Τεχνητή Νοημοσύνη της Google;" και το ερώτημα αποστέλλεται.
Δεύτερον, το Gemini αναλύει την εικόνα, αναζητά σήματα SynthID και Επιστρέφει ένα μήνυμα με την αξιολόγησή του.Εάν εντοπίσει την επωνυμία, το δηλώνει ρητά. Εάν δεν την εντοπίσει, εξηγεί ότι δεν δημιουργήθηκε με την τεχνητή νοημοσύνη της Google ή ότι δεν μπορεί να το προσδιορίσει με απόλυτη βεβαιότητα. Σε ορισμένες περιπτώσεις, υποδεικνύει επίσης ότι δεν είναι δυνατόν να γνωρίζουμε εάν χρησιμοποιήθηκε κάποιο άλλο εξωτερικό εργαλείο τεχνητής νοημοσύνης.
Το τρίτο βήμα είναι να ερμηνεύσετε την απάντηση με ορισμένα κριτήρια. Η απουσία της επωνυμίας SynthID δεν σημαίνει απαραίτητα ότι η φωτογραφία είναι αυθεντική. Με την κλασική έννοια (λήψη με κάμερα χωρίς καμία παραποίηση), απλώς υποδεικνύει ότι το σήμα της Google δεν ανιχνεύεται. Θα μπορούσε να είναι μια πραγματική εικόνα, μια εικόνα που δημιουργείται από άλλη τεχνητή νοημοσύνη ή περιεχόμενο που έχει τροποποιηθεί τόσο έντονα ώστε η επωνυμία να έχει υποβαθμιστεί σημαντικά.
Η Google αναγνωρίζει ότι υπάρχουν τεχνικοί περιορισμοί σε ακραίες περιπτώσειςΠολύ απλές εικόνες, αρχεία που έχουν υποστεί σοβαρή αλλοίωση από διαδοχικές συμπιέσεις ή πολύ επιθετική επεξεργασία μπορούν να δυσχεράνουν την ανάγνωση του υδατογραφήματος. Παρόλα αυτά, το σύστημα έχει σχεδιαστεί για να αντέχει σε συνήθεις περικοπές, αλλαγές μεγέθους και προσαρμογές φωτεινότητας ή χρώματος, με στόχο να το καταστήσει χρήσιμο σε δικτύωση και ανταλλαγή μηνυμάτων στον πραγματικό κόσμο.
SynthID, C2PA και ο στόχος της καλύτερης παρακολούθησης ψηφιακού περιεχομένου
Η ενσωμάτωση του SynthID στο Gemini δεν γίνεται μόνη της. Η Google συμμετέχει επίσης C2PA, ένας διεθνής συνασπισμός για την προέλευση και την αυθεντικότητα του περιεχομένου η οποία περιλαμβάνει εταιρείες όπως η Adobe, η OpenAI, η Meta και η Microsoft. Αυτή η ομάδα έχει δημιουργήσει ένα πρότυπο μεταδεδομένων που επιτρέπει την συμπερίληψη αξιόπιστων πληροφοριών σχετικά με την προέλευση και το ιστορικό επεξεργασίας μιας εικόνας, ήχου ή βίντεο.
Στην πράξη, αυτά Τα μεταδεδομένα C2PA λειτουργούν ως ένα είδος τεχνικού φύλλου δεδομένων ενσωματωμένου στο αρχείοΑυτό υποδεικνύει ποιο εργαλείο χρησιμοποιήθηκε για τη δημιουργία του περιεχομένου, ποιες τροποποιήσεις έγιναν και πότε. Η Google αρχίζει να ενσωματώνει αυτό το είδος διαπιστευτηρίων σε εικόνες που δημιουργούνται από μοντέλα όπως το Nano Banana Pro εντός της εφαρμογής Gemini, καθώς και σε δημιουργίες που γίνονται μέσω του Vertex AI και του Google Ads.
Ο συνδυασμός SynthID και C2PA επιτρέπει, αφενός, Σημειώστε τις εικόνες που δημιουργούνται από την Τεχνητή Νοημοσύνη της Google Και, αφετέρου, να προσφέρει ένα κανάλι για την επαλήθευση αρχείων που προέρχονται από εργαλεία τρίτων που υιοθετούν το πρότυπο. Η πρόθεση της εταιρείας είναι να επεκτείνει σταδιακά αυτά τα μεταδεδομένα σε περισσότερα προϊόντα, συμπεριλαμβανομένων υπηρεσιών που χρησιμοποιούνται ευρέως στην Ευρώπη, όπως το YouTube, το Google Photos και η ίδια η Αναζήτηση.
Για δημοσιογράφους, ελεγκτές γεγονότων και ψηφιακά μέσα ενημέρωσης στην Ισπανία και σε άλλες ευρωπαϊκές χώρες, η πρόσβαση σε Ένας τυποποιημένος μηχανισμός προέλευσης περιεχομένου μπορεί να είναι καθοριστικός. σε ευαίσθητη κάλυψη, από προεκλογικές εκστρατείες έως διεθνείς συγκρούσεις. Επί του παρόντος, η χρήση του C2PA αυξάνεται, αλλά η υιοθέτησή του δεν είναι ακόμη καθολική, επομένως η πλήρης ιχνηλασιμότητα παραμένει μεσοπρόθεσμος στόχος.
Εκτός από την άμεση ενσωμάτωση στην εφαρμογή, η Google δοκιμάζει αυτήν την τεχνολογία σε μια συγκεκριμένη πύλη επαλήθευσης, Ανιχνευτής SynthIDΑρχικά σχεδιασμένο για δημοσιογράφους, ερευνητές και επαγγελματίες των μέσων ενημέρωσης, αυτό το εργαλείο επισημαίνει τα μέρη μιας εικόνας που είναι πιο πιθανό να επισημανθούν και συμπληρώνει τη γενικότερη χρήση που προσφέρει τώρα το Gemini.
Μελλοντικά σχέδια: από εικόνες σε βίντεο, ήχο και αναζήτηση
Η Google έχει καταστήσει σαφές ότι δεν θέλει να περιορίσει την επαλήθευση σε στατικές φωτογραφίες. Τα σχέδιά τους περιλαμβάνουν την επέκταση του SynthID σε μορφές όπως βίντεο και ήχο.Αυτό θα επιτρέψει την πιο αξιόπιστη αναγνώριση περιεχομένου που παράγεται από τεχνητή νοημοσύνη σε αυτές τις πλατφόρμες. Αυτό είναι ιδιαίτερα σημαντικό δεδομένου του πολλαπλασιασμού των φωνητικών και βίντεο deepfakes, τα οποία έχουν ήδη οδηγήσει σε περιστατικά παραπληροφόρησης σε αρκετές ευρωπαϊκές χώρες.
Ένας άλλος στόχος είναι να αξιοποιηθούν αυτές οι δυνατότητες σε υπηρεσίες ευρείας εμβέλειας, όπως π.χ. Αναζήτηση Google, η μηχανή αναζήτησηςΗ ιδέα είναι ότι όταν ένας χρήστης βρίσκει μια εικόνα στο διαδίκτυο, μπορεί εύκολα να ελέγξει αν πρόκειται για περιεχόμενο που δημιουργείται από τεχνητή νοημοσύνη και, εάν ναι, ποιο μοντέλο χρησιμοποιεί. Αυτός ο τύπος πληροφοριών περιβάλλοντος ενσωματώνεται ήδη σταδιακά σε ορισμένα αποτελέσματα αναζήτησης, αλλά η συγκεκριμένη ενσωμάτωση του SynthID και του C2PA βρίσκεται ακόμη σε εξέλιξη.
Εν τω μεταξύ, η Google συνεχίζει ενσωμάτωση του SynthID σε άλλα εργαλεία στο οικοσύστημά του, όπως η λειτουργία Magic Editor και Reimagine σε τηλέφωνα Pixel, οι οποίες επιτρέπουν την επεξεργασία φωτογραφιών με τεχνητή νοημοσύνη. Με αυτόν τον τρόπο, τυχόν ουσιαστικές αλλαγές που πραγματοποιούνται από αυτά τα συστήματα επισημαίνονται για μελλοντική ανίχνευση, προσθέτοντας ένα επίπεδο διαφάνειας σε λειτουργίες που διαφορετικά θα μπορούσαν να παράγουν εικόνες που είναι δύσκολο να διακριθούν από μια παραδοσιακή φωτογραφία.
Η εταιρεία αναγνωρίζει ότι, έως ότου υπάρξει ένα καθολικά υιοθετημένο σύστημα branding σε όλες τις πλατφόρμες δημιουργίας εικόνων, η επαλήθευση θα είναι αναγκαστικά μερική. Ωστόσο, επιμένει ότι κάνουν αυτό το βήμα μέσα στο δικό τους οικοσύστημα Είναι ένας τρόπος για να προωθηθεί η υιοθέτηση προτύπων και να προσφερθούν στους χρήστες συγκεκριμένα εργαλεία για την πλοήγηση σε ένα ολοένα και πιο πολύπλοκο ψηφιακό περιβάλλον.
Στην περίπτωση της Ευρώπης, όπου τα θεσμικά όργανα της ΕΕ εργάζονται πάνω σε κανονιστικά πλαίσια για την τεχνητή νοημοσύνη και την παραπληροφόρηση, αυτό το είδος τεχνολογικής πρωτοβουλίας μπορεί να ταιριάξει ως εξής: ένα πρακτικό συμπλήρωμα στις νομικές απαιτήσεις, καθιστώντας διαθέσιμα στους πολίτες, τα μέσα ενημέρωσης και τις διοικήσεις συστήματα επαλήθευσης προσβάσιμα από κινητά τηλέφωνα.
Τι μπορεί και τι δεν μπορεί να κάνει η επαλήθευση των Διδύμων σήμερα;
Αν και η κυκλοφορία αυτής της λειτουργίας αποτελεί ένα σημαντικό βήμα προς τα εμπρός, Ο Δίδυμος δεν είναι ένα μαγικό εργαλείο που λύνει όλα τα προβλήματα αυθεντικότητας.Προς το παρόν, η δύναμή του έγκειται στο να υποδεικνύει εάν μια εικόνα έχει δημιουργηθεί ή υποστεί επεξεργασία από την τεχνητή νοημοσύνη της Google χάρη στο SynthID. Πέρα από αυτό, ο βοηθός μπορεί να κάνει εκτιμήσεις μόνο με βάση την οπτική ανάλυση.
Σε δοκιμές με εικόνες που δημιουργούνται από άλλα εργαλεία, όπως εξωτερικά μοντέλα που δεν χρησιμοποιούν SynthID, το Gemini έχει καταφέρει περιστασιακά να να διαισθανθεί ότι επρόκειτο για συνθετικό περιεχόμενοΩστόσο, δεν διαθέτει το επίπεδο βεβαιότητας που προσφέρει κατά την ανίχνευση του αόρατου υδατογραφήματος. Έχουν επίσης παρατηρηθεί περιπτώσεις όπου το σύστημα ερμηνεύει μια φωτογραφία ως πρωτότυπη, ενώ στην πραγματικότητα προέρχεται από άλλη τεχνητή νοημοσύνη, αποδεικνύοντας ότι η καθαρά οπτική ανάλυση εξακολουθεί να έχει περιθώριο σφάλματος.
Οι Δίδυμοι μπορούν μερικές φορές να υποδηλώνουν μηνύματα όπως: «Αυτή η εικόνα δεν δημιουργήθηκε με την Τεχνητή Νοημοσύνη της Google, αλλά δεν είναι δυνατόν να προσδιοριστεί εάν δημιουργήθηκε με άλλα εργαλεία Τεχνητής Νοημοσύνης.»Με άλλα λόγια, ο βοηθός αναγνωρίζει με σαφήνεια τους περιορισμούς του όταν δεν διαθέτει τεχνικά σήματα που του επιτρέπουν να επιβεβαιώσει την προέλευση της εικόνας.
Για τον μέσο χρήστη, αυτό σημαίνει ότι η λειτουργία επαλήθευσης θα πρέπει να νοείται ως ένα ακόμη εργαλείο μέσα σε ένα σύνολο εργαλείωνΚαι όχι ως το μοναδικό κριτήριο για να αποφασιστεί αν θα πιστέψουμε ή όχι μια φωτογραφία. Η κριτική στάση απέναντι στα συμφραζόμενα, την πηγή που την μοιράζεται και τη χρήση της εικόνας εξακολουθεί να είναι θεμελιώδης, ειδικά σε ευαίσθητα θέματα όπως η πολιτική, η υγεία ή η ασφάλεια.
Ωστόσο, η δυνατότητα γρήγορης μεταφόρτωσης μιας φωτογραφίας στην εφαρμογή Gemini και λήψης μιας απάντησης με βάση τα συμφραζόμενα σε λίγα δευτερόλεπτα είναι ένα πλεονέκτημα. Αντιπροσωπεύει έναν πρακτικό πόρο για την ανίχνευση τουλάχιστον των εικόνων που συνδέονται με το οικοσύστημα της Google, κάτι ιδιαίτερα χρήσιμο σε ψηφιακές διαφημιστικές καμπάνιες, χορηγούμενο περιεχόμενο, viral ειδήσεις ή γραφικούς πόρους που κυκλοφορούν σε δίκτυα στην Ισπανία και την υπόλοιπη Ευρώπη.
Η άφιξη αυτής της λειτουργίας στην εφαρμογή Gemini εντάσσεται σε μια σαφή τάση στον τομέα της τεχνολογίας: μεγάλες εταιρείες που ενσωματώνουν συστήματα ελέγχου ταυτότητας και προέλευσης απευθείας στα προϊόντα σας σε μια προσπάθεια περιορισμού του αντίκτυπου της παραπληροφόρησης και του χειραγωγημένου περιεχομένου. Σε αυτό το πλαίσιο, ο συνδυασμός αόρατων υδατογραφημάτων, τυποποιημένων μεταδεδομένων και επεξηγήσεων φυσικής γλώσσας από τον ίδιο τον βοηθό θέτει τους χρήστες σε καλύτερη θέση να κατανοήσουν τι κρύβεται πίσω από κάθε εικόνα που βλέπουν στις οθόνες τους.