撰稿人、站长、产品经理、架构师、独立开发者。
概述 最近,一个文本转语音的模型比较火,那就是:ChatTTS。而且,这个模型还是国内的一个小团队搞的。专注于 […]
GPT-4o的发布标志着混合输入输出大模型的新里程碑,对话更丰富、速度更快。其免费使用和降低的API费用使更多人能够接触到这项技术。相较于Gemini1.5 Pro,GPT-4o在对话体验方面更胜一筹,推动了机器人和AIGC应用的发展。这一进步代表着生成式AI领域的重要发展,为人机交互和内容生成等领域带来了新的可能性。
视频生成模型如Sora和Stable Video Dissfusion常面临无法精准控制输出视频的问题,尤其是在人物动作上。可控视频模型能通过提示词精确控制视频中的人物动作。Viggle AI,作为首个具备实际物理理解能力的视频-3D模型,能自由控制角色动作,并植入于Discord平台。这种可控视频技术将显著降低数字人产品成本,并实现多样化的数字人视频创作。
Suno AI,一款能通过提示词生成音乐和歌曲的大型模型,近期颇受欢迎。尽管没有官方API支持,但通过非官方接口也可利用其功能。用户只需填入音乐类型和点击“Create”即可生成音乐,体现了AI音乐生成的广阔前景和便捷性。
Kimi模型引起国内AIGC领域关注,已集成至AI SEO CN版Wordpress插件中。由月之暗面科技公司开发,特点是长文本输入与输出,最高可达200万字。用户通过注册和API密钥在平台操作,并可选择不同上下文长度模型。价格根据模型和用户等级变化,集成应用简易且性能良好。
The AI SEO Wordpress Plugin is being upgraded to support Baidu’s ERNIE 4.0 8K, although tests show little difference in SEO effectiveness compared to ERNIE 3.5 8K. Despite better stylistic quality with 4.0, the newer model is significantly more expensive and slower, with higher error rates during batch processing. Thus, ERNIE 3.5 8K remains the more cost-effective choice for SEO purposes.
春节前后, Google调整了其对AI生成内容的态度,导致大量用AI生成摘要的网站被K。但Google实际反对的是大量重复内容。SEOer应制作对用户有用且有差异的内容,理解搜索意图并创造内容。AI SEO Wordpress插件新增功能帮助按大纲生成有用和独特的内容。
用户在测试新升级的多模态AI模型Gemini 1.5 Pro后发现,尽管它支持更全面的输入类型包括文字、图片、视频、文件和文件夹,推理能力却没有显著提升,特别在分辨是非方面。此外,处理视频、文件和文件夹输入时耗时较长,并且对大量数据的处理存在限制。
最近开发了一个基于最新版本Stable Diffusion XL (SDXL) 的WordPress插件。Stable Diffusion是一个免费、开源的图像生成模型,通过官方网站Stability AI可以直接下载代码。尽管自行部署模型的成本和难度较大,但可以使用Docker映像或手动安装。此外,还可以通过Replicate.com网站使用或部署大模型和API。总的来说,Stable Diffusion和SDXL广泛应用于AI图像生成产品。
After constructing two sites with Next.js last month and noticing poor Google indexation, the issue was identified as a missing robots.txt file. To address this, a robots.txt with rules to allow all user-agents, enable access to all content excluding the ‘private’ directory, and link a sitemap was added to the Next.js app directory. This resolved the indexing issue, underscoring the importance of robots.txt for site visibility.