Vlastník sociální sítě TikTok, společnost ByteDance, představila nový AI model s názvem OmniHuman, který dokáže vytvořit vysoce realistická videa lidí z jediné fotografie. Schopnost tohoto videogenerátoru byla demonstrována oživením Alberta Einsteina. Panují však obavy ze zneužití technologie.
OmniHuman vyniká v produkci realistických videí s minimálními vstupy, podporuje jakýkoli poměr stran obrazu a poskytuje kvalitní výsledky v různých scénářích. Na ukázková videa zveřejněná na serveru arXiv, která předvádějí jeho schopnost vytvářet věrohodná gesta a řeč pomocí zvuku z různých zdrojů, upozornil magazín Forbes.
Odborníci naznačují, že by tato technologie mohla revolučně změnit vzdělávání a média, například možností nahradit lidské influencery a tvůrce obsahu v budoucnu. Zároveň ale panují obavy ze zneužití technologie pro vytváření takzvaných deepfake videí. Podvodníkům totiž může stačit jediná fotografie a krátký hlasový záznam.
Video s Einsteinem je po vizuální stránce špičkové, slova mu ale nejsou vlastní. Záznam pochází z projevu neurovědce a výzkumníka zvířecích emocí Jaaka Pankseppa, jenž byl pořízený před více než deseti lety na akci TedXRainier v Seattlu.
OmniHuman je pro vlastníky TikToku mocným nástrojem. Odborníci předpokládají, že ByteDance hledá nové cesty monetizace sociálních sítí. Nový videogenerátor by v budoucnu mohl zcela nahradit influencery, čímž by se o výdělky z reklamy nemusela společnost s nikým dělit.