Große Veränderungen im Internetnutzerverhalten

Strömungsträger und Bambuskorb zum Entnehmen von Wasser

Beim E-Commerce dreht sich alles um Traffic und Conversion – ein Rückblick und eine Zusammenfassung der Entwicklung des E-Commerce

Über die Entstehung von Kreisen – schnelles Sammeln von Menschen und genaue Erkenntnis

Dokumentbasiertes WEB und anwendungsbasiertes WEB

Internetuhr

ChatTTS: Text-to-Speech-Modell für Konversationsszenarien

Überblick In letzter Zeit erfreut sich ein Text-to-Speech-Modell großer Beliebtheit: ChatTTS. Darüber hinaus wurde dieses Modell von einem kleinen Team in China entwickelt. konzentrieren Sie sich auf[…]

InternetuhrAutor:Neo-Yang

GPT-4o: Kostenlose große Modelle mit gemischter Eingabe und gemischter Ausgabe

Die Veröffentlichung von GPT-4o markiert einen neuen Meilenstein bei großen Hybrid-Input-Output-Modellen mit reichhaltigeren und schnelleren Gesprächen. Die kostenlose Nutzung und die reduzierten API-Gebühren machen diese Technologie für mehr Menschen zugänglich. Im Vergleich zu Gemini1.5 Pro ist GPT-4o im Gesprächserlebnis überlegen und fördert die Entwicklung von Robotern und AIGC-Anwendungen. Dieser Fortschritt stellt eine wichtige Entwicklung im Bereich der generativen KI dar und eröffnet neue Möglichkeiten für Bereiche wie Mensch-Computer-Interaktion und Inhaltsgenerierung.

InternetuhrAutor:Neo-Yang

Viggle AI: So generieren Sie Videos mit kontrollierbaren Charakterbewegungen

Videogenerierungsmodelle wie Sora und Stable Video Dissfusion stehen oft vor dem Problem, dass sie das Ausgabevideo nicht genau steuern können, insbesondere bei Charakterbewegungen. Das steuerbare Videomodell kann die Aktionen der Charaktere im Video durch Aufforderungsworte genau steuern. Viggle AI ist das erste Video-3D-Modell mit tatsächlichen physischen Verständnisfähigkeiten, kann die Bewegungen von Charakteren frei steuern und ist in die Discord-Plattform eingebettet. Diese steuerbare Videotechnologie wird die Kosten digitaler menschlicher Produkte erheblich senken und eine vielfältige Erstellung digitaler menschlicher Videos ermöglichen.

InternetuhrAutor:Neo-Yang

Persönlicher Test von Google Gemini 1.5 Pro: leistungsstark und zerbrechlich zugleich

Nach dem Test des neu aktualisierten multimodalen KI-Modells Gemini 1.5 Pro stellten Benutzer fest, dass es zwar einen umfassenderen Eingabetyp unterstützt, einschließlich Text, Bilder, Videos, Dateien und Ordner, die Argumentationsfähigkeit jedoch nicht wesentlich verbessert wurde, insbesondere bei der Unterscheidung von rechts und links falsch. Darüber hinaus nimmt die Verarbeitung von Video-, Datei- und Ordnereingaben viel Zeit in Anspruch und es bestehen Einschränkungen bei der Verarbeitung großer Datenmengen.

InternetuhrAutor:Neo-Yang

Heiße Themen im Februar 2024: Sora – das große Videogenerierungsmodell von Open AI

Am 16. Februar 2024 veröffentlichte Open AI sein fortschrittliches Videogenerierungsmodell namens Sora, das fast das Interesse von Sora weckt, das noch nicht für die öffentliche Nutzung verfügbar ist und Transformer- und Diffusionsarchitekturen für hochauflösende Open AIs kombiniert TikTok demonstriert die Fähigkeiten von Sora anhand unbearbeiteter Videos aus verschiedenen Eingabeaufforderungen und gibt einen Ausblick auf seine potenziellen Auswirkungen auf den aufstrebenden Bereich der Videogenerierung.

InternetuhrAutor:Neo-Yang