• Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
07/12/2025 08:48 Dimanche
  • Connexion
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
Pas de résultat
Voir tous les résultats
page de garde  Application

La génération d'images Google Gemini ajoute davantage d'outils d'édition, met l'accent sur la cohérence des caractères et utilise des filigranes numériques pour garantir la transparence.
Défi DALL·E, Firefly et Stable Diffusion

Écrit par : Mash Yang
2025-08-27
in  Application , 生活, réseau, Logiciel
A A
0
Partager sur FacebookPartager sur TwitterPartager sur LINE

Google宣布Google a annoncé une nouvelle série de mises à jour de fonctionnalités pour son modèle de génération d'images Gemini, améliorant notamment l'édition par l'IA, la cohérence de la génération et la flexibilité. Cette mise à jour, développée par l'équipe DeepMind, est désormais disponible dans l'application Gemini. Google a également souligné que toutes les images générées ou modifiées via Gemini seront accompagnées d'un filigrane numérique visible indiquant clairement leur origine générée par l'IA.

Renforcer la cohérence des rôles et améliorer la précision de l'édition

L’un des points forts de la nouvelle version est qu’elle peut garantir la cohérence des personnages en portrait lors de l’édition continue des images.

Par le passé, lorsque l'IA générait ou modifiait des images à plusieurs reprises, les personnages présentaient souvent des différences de détails, comme des traits du visage, des vêtements ou des proportions incohérents. Le nouveau modèle de Gemini préserve l'authenticité des personnages générés, permettant aux utilisateurs d'insérer plus naturellement leurs propres images dans différentes scènes ou tenues, sans les effets de « changement de visage » liés aux modifications répétées.

https://mashdigi.com/wp-content/uploads/Character_consistency_TR7mVxk.mp4

Une autre amélioration réside dans l'ajout de la retouche d'image en plusieurs étapes, permettant aux utilisateurs de modifier progressivement des éléments de l'image, par exemple en ajustant d'abord l'arrière-plan, puis en remplaçant des objets spécifiques, sans perdre les modifications précédentes. Gemini peut également combiner deux images pour créer une nouvelle scène ou utiliser des éléments d'images existantes pour créer de nouveaux éléments de design, augmentant ainsi la flexibilité créative.

https://mashdigi.com/wp-content/uploads/ImageEditingGemini_Inline_XZuiDzE.mp4
https://mashdigi.com/wp-content/uploads/Blend_photos_together_w8GsoJi.mp4

Comparaison avec d'autres outils de génération d'images

L'évolution de Gemini permet à Google de concurrencer plus directement d'autres outils d'IA générative :

• OpenAI DALL·E 3 :Actuellement, ChatGPT est hautement intégré et prend en charge la conversion de texte en image et l'inpainting. Cependant, le nouveau modèle de Gemini présente un avantage certain en termes de contrôle de la cohérence des caractères, ce qui le rend particulièrement attractif pour les utilisateurs exigeant une création continue.

• Adobe Firefly :Axé sur les créateurs et le secteur du design, Gemini privilégie les licences commerciales d'images générées et intègre des outils comme Photoshop et Illustrator. Bien qu'il ne dispose pas d'un écosystème logiciel professionnel complet, sa capacité à gérer les personnages sur plusieurs scènes en fait une option légère et prometteuse pour accompagner les créateurs.

• Diffusion stable :Connu pour son open source et sa grande personnalisation, Gemini permet aux utilisateurs de réaliser diverses modifications grâce à des modèles locaux ou des plug-ins communautaires. Cependant, pour les utilisateurs plus expérimentés, Gemini s'intègre aux services cloud et Google, offrant une expérience plus conviviale et réduisant la courbe d'apprentissage.

Transparence générée par l'IA et impact futur

Google a souligné que toutes les images générées via Gemini seront automatiquement filigranées numériquement afin de garantir transparence et traçabilité. L'imagerie générative par l'IA étant de plus en plus utilisée dans les médias, la publicité, l'éducation et le divertissement, cette conception répond également aux préoccupations concernant les « deepfakes » et la désinformation.

Les fonctionnalités améliorées de Gemini permettent à Google d'aller au-delà de la simple fourniture d'outils sur le marché de la génération d'images par IA et de réfléchir davantage à la manière de garantir une confiance durable dans les images générées. Alors que ses concurrents se renforcent dans leurs domaines respectifs, Gemini a trouvé sa place dans la cohérence des caractères, la flexibilité d'édition et la transparence. Sa capacité à concurrencer plus directement DALL·E, Firefly et Stable Diffusion à l'avenir constituera une étape importante.

Tableau comparatif des outils de génération et d'édition d'images IA

Nom de l'outil 主要 特色 Fonction d'édition Dominance Restrictions/Litige
Google Gemini (DeepMind) Intégration à l'écosystème Google, prise en charge de la génération et de l'édition – Maintenir la continuité du personnage
– Montage multi-segments sans interruption
– Synthèse d’images (fusion de plusieurs images)
– Conversion de fonctionnalités visuelles
– L’accent est mis sur la cohérence, en particulier la stabilité des images de caractères
– Tout le contenu comporte des filigranes numériques pour une identification facile
– Les fonctions initiales sont concentrées dans l’application Gemini
– Doit encore prouver sa maturité par rapport aux outils de conception professionnels
luciole d'adobe Intégration approfondie avec Photoshop et Illustrator – Remplissage génératif
– Transfert de style
– Génération de vecteurs
– Intégration transparente avec l’écosystème des logiciels de conception
– Convient aux designers professionnels
– Nécessite un abonnement à la suite Adobe, ce qui est coûteux
OpenAI DALL·E (actuellement v3) Intégration profonde avec ChatGPT – Inpainting (édition par blocs)
– Texte en image
– Faible barrière à l’entrée et fonctionnement conversationnel intuitif
– Convient pour une idéation et un storyboard rapides
– Montage plus génératif, moins flexible et précis que Firefly
À mi-parcours Axé sur la communauté, bon en style artistique – Réglage rapide et précis
– Déformation locale
– Résolution améliorée
– Sens artistique fort et images générées délicates
– Partager l’inspiration avec la communauté
– S’appuie sur le fonctionnement de la plateforme Discord
– L’autorisation d’utilisation commerciale nécessite une attention particulière
Diffusion stable Écosystème communautaire open source – Retouche
– ControlNet (contrôle détaillé)
– Ajustement fin du modèle
– Hautement personnalisable, capable de former des modèles dédiés
– Pas limité à une seule plateforme
– Seuil technique élevé
– La qualité de génération d’image varie considérablement selon le modèle
Mots clés: AIGEMINIGoogleIntelligence artificielleCréation d'imagesFiligrane numérique
PartagezTweetPartagez
Mash Yang

Mash Yang

Fondateur et rédacteur en chef de mashdigi.com, et étudiant en journalisme technologique.

Laissez un commentaire Annuler la réponse

Votre adresse courriel n'apparaitra pas. Les champs obligatoires sont marqués *

Ce site utilise Akismet pour réduire les spams. Découvrez comment vos données de commentaire sont traitées.

  • Populaire
  • 留言
  • 最新
Sony dévoile le Xperia PRO, un téléphone phare en cours de développement, prenant en charge les bandes d'ondes inférieures à 6 GHz et millimétriques

Sony dévoile le Xperia PRO, un téléphone phare en cours de développement, prenant en charge les bandes d'ondes inférieures à 6 GHz et millimétriques

2020-02-24
Interview/Le nouveau téléphone phare de Sony, le Xperia 5, se positionne-t-il comme un téléphone « Compact » ?

Interview/Le nouveau téléphone phare de Sony, le Xperia 5, se positionne-t-il comme un téléphone « Compact » ?

2019-09-07
La Fondation Raspberry Pi a annoncé la carte de développement Raspberry Pi 5, indiquant que les problèmes de chaîne d'approvisionnement se sont améliorés.

La Fondation Raspberry Pi a annoncé la carte de développement Raspberry Pi 5, indiquant que les problèmes de chaîne d'approvisionnement se sont améliorés.

2023-09-28
À partir de mai de l'année prochaine, Google donnera la priorité aux pages Web non AMP dans les résultats de recherche mobile

À partir de mai de l'année prochaine, Google donnera la priorité aux pages Web non AMP dans les résultats de recherche mobile

2
La société mère d'Ubuntu confirme son intention d'entrer en bourse, mais aucun calendrier précis n'a été fixé.

La société mère d'Ubuntu confirme son intention d'entrer en bourse, mais aucun calendrier précis n'a été fixé.

1

Sony Interactive Entertainment confirme que la PlayStation 5 ne sera rétrocompatible qu'avec la plupart des jeux PlayStation 4.

0
L'acquisition par Meta de la start-up Limitless, spécialisée dans les dispositifs portables basés sur l'IA, élargit son portefeuille de matériel au-delà des lunettes et des appareils montés sur la tête ; elle pourrait également lancer un pendentif intelligent alimenté par l'IA.

L'acquisition par Meta de la start-up Limitless, spécialisée dans les dispositifs portables basés sur l'IA, élargit son portefeuille de matériel au-delà des lunettes et des appareils montés sur la tête ; elle pourrait également lancer un pendentif intelligent alimenté par l'IA.

2025-12-07
Les premières lunettes intelligentes de Meta avec écran, les Ray-Ban Display, seront vendues au prix de 799 $ et seront mises en vente aux États-Unis le 9 septembre.

Les lunettes de réalité mixte de nouvelle génération de Meta, baptisées « Phoenix », seraient retardées jusqu'en 2027 et devraient adopter une conception avec une unité de calcul externe.

2025-12-07
La nouvelle fonctionnalité de Facebook : Meta AI analyse les photos qui n'ont pas encore été téléchargées, ce qui soulève des inquiétudes en matière de confidentialité

Pour aider Meta AI à mieux comprendre l'actualité, Meta a signé des accords de licence de contenu avec plusieurs médias d'information, dont CNN et Fox News.

2025/12/06 - Mis à jour le 2025/12/07
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances

Copyright © 2017 mashdigi.com

  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Suivez-nous

Ravis de vous revoir!

Connectez-vous à votre compte ci-dessous

Mot de passe oublié?

Récupérez votre mot de passe

Vous avez déjà une adresse e-mail? Cliquez ici.

Se connecter
Pas de résultat
Voir tous les résultats
  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Copyright © 2017 mashdigi.com