AIneon CG&AI 本周快讯 (12.5-12.11)

注：本图为DALL.E根据本文内容生

前言：

欢迎阅读本周的AIneon CG&AI 快讯，在这里我们将带您一探AI和CG领域的最新动态。从Mistral AI的创新型大型语言模型，到Meta基于用户照片训练的AI图像生成器，再到Google推出的强大AI模型Gemini，本周的报道聚焦于人工智能技术的快速演进和广泛应用。此外，我们还涉及了Reallusion和Nevercenter在3D动画和建模软件上的重大更新，为您提供对AI和CG技术未来趋势的洞见。

Mistral AI发布破格的MoE 8x7B LLM，AI社区响应热烈

发布日期：2023年12月10日

引言

Mistral AI以其非传统的方式发布最新的大型语言模型（LLM）MoE 8x7B，通过种子链接而非常规途径，引发AI社区广泛讨论。

内容摘要：

MoE 8x7B模型以其独特的发布方式获得关注，被视为缩小版的GPT-4，每个专家有111B参数，共有55B共享注意力参数。
该模型的发布策略获得业界专家的赞誉，其中包括Uri Eliabayev、AI顾问和1X Technologies的AI副总裁Eric Jang。
Mistral AI最近在一轮由Andreessen Horowitz领投的融资中估值达20亿美元，并在欧洲创下1.18亿美元种子轮融资纪录。
该公司一直积极参与欧盟AI法案的讨论，主张对开源AI减少监管。

分析评论：

Mistral AI的非传统发布策略不仅展示了其对开源创新的承诺，还标志着该公司在不断演变的AI市场中成为重要参与者。此举挑战了传统发布规范，倡导一个更开放的AI生态系统，预示着其在技术领域的潜在影响力。

CHAR观点：

“人狠话少，说的就是这种类型的公司。持续关注中。

Stability AI以StableLM Zephyr 3B走向“小型化”，创新AI模型

发布日期：2023年12月7日

引言：

Stability AI近日发布了其最新的3亿参数大型语言模型（LLM）StableLM Zephyr 3B，这一较小、优化的版本表明了公司在AI领域的新方向。

内容摘要：

Stability AI发布了StableLM Zephyr 3B，这是一款3亿参数的大型语言模型，适用于聊天、文本生成、摘要和内容个性化等用途。
这个模型比7亿参数的StableLM模型小，但在Q&A和指令跟随类任务上已优化，适用于更广泛的硬件，资源占用更低。
StableLM Zephyr 3B采用直接偏好优化（DPO）训练方法，与大型模型相比，在更小的尺寸上仍保持良好性能。
Stability AI还发布了其他模型，如StableCode（用于应用代码开发的生成AI模型）和Stable Audio（文本到音频生成工具）。

分析评论：

Stability AI的StableLM Zephyr 3B展示了该公司在AI领域的灵活性和创新能力。通过缩小模型规模，在保持高性能的同时实现更广泛的应用和部署，这一策略有望在AI市场产生重要影响。

CHAR观点：

“我认为小模型的最大用处就是未来可以放在离线的小型设备里使用。这样就不会担心自己的命运总是握在大厂手里了。”

Meta推出基于用户FB和IG照片训练的AI图像生成器

发布日期：2023年12月7日

引言：

Meta公司近日推出了一款新型AI图像生成器“Imagine”，该生成器是基于Facebook和Instagram用户的照片进行训练的。

内容摘要：

Meta推出的“Imagine”是一款独立的文本到图像AI生成器，用户可以通过其网站进行图像生成。
该服务建立在Meta自主研发的AI模型“Emu”之上，该模型利用11亿张Facebook和Instagram用户照片进行训练。
尽管Meta排除了私人消息和未公开分享的图像，但该做法仍引发了对用户照片被此类用途使用的担忧。
早期反应褒贬不一，一些艺术家和用户在测试中发现生成的图像偶尔会出现不真实的人物造型和结构，以及一些奇怪的视觉错误。

分析评论：

Meta的这一步举措显示了其在AI艺术生成领域的进一步探索。尽管这种依赖用户照片的训练方法引发了一些隐私和版权方面的担忧，但它也体现了Meta在利用现有数据资源进行AI创新的努力。

CHAR观点：

AI技术未来的关键在于掌握大量丰富数据。Meta当前面临的不仅是道德问题的挑战，更重要的是数据的数量与质量。

Deepdub创新性推出AI语音克隆版税计划

发布日期：2023年12月7日

引言：

Deepdub，一家与HBO Max和Fox有合作关系的初创公司，最近推出了一项面向AI语音克隆的版税计划，旨在为声音艺术家提供新的收入来源。

内容摘要：

Deepdub提供用于视频、音频轨道、游戏等媒体中配音的人工智能（AI）工具，允许演讲者用母语录制声音，然后通过AI技术将其翻译成多种其他语言和方言，同时保留其独特原始声音。
公司本周推出了新的版税计划，允许声音艺术家录制他们的声音，将其转化为未来AI生成的声音轨迹，并在其AI克隆声音在新制作中使用时获得报酬。
Deepdub声称，通过其基于网络的平台，提供“语音转换端到端本地化服务”，包括视频中的唇动同步，确保翻译后的视频看起来和听起来像是演讲者用另一种语言流利地录制的内容。

分析评论：

Deepdub的AI语音克隆版税计划是对AI领域的一次创新尝试，不仅为声音艺术家提供了一种新的收益模式，还推动了AI技术在配音和语言转换领域的发展。这一策略可能会在娱乐和广告行业引发更广泛的应用和变革。

CHAR观点：

虽然这个项目颇具前景，但我总感觉它可能会被未来的‘音色模型’所取代。作为一名创作者，台词和旁白对于影视作品至关重要。然而，我更倾向于使用自己独特创造的音色来展现我创作中的角色。

Civitai创始人倡导开源，淡化AI深伪色情问题

发布日期：2023年12月10日

引言：

Civitai创始人Justin Maier在开源AI平台上的努力，尽管面临个人和职业上的挑战，但依然强调积极的社区发展和内容监管。

内容摘要：

Civitai公司一年内从四人创业团队，发展成为拥有1000万独立访客的15人公司，获得500万美元的风险投资。
该公司致力于支持社区发现、创建、分享基于流行的文本到图像生成器Stable Diffusion的模型和图像生成内容。
Civitai面临媒体对其创建“AI色情市场”和涉嫌生成儿童色情内容的指控，但Maier坚称这些报道歪曲了Civitai的主要用户群和用例。
Civitai的大部分用户是LoRA模型爱好者，利用AI艺术生成进行各种创作。
Maier强调，尽管Civitai努力确保内容安全，但行业的快速发展和兴趣的增长要求公司每日适应和变革。
Civitai作为开源生成AI的典范，展现了技术的潜力和挑战，尤其是在内容审查和管理方面。

分析评论：

Civitai的例子展现了开源生成AI技术的前景和挑战。尽管面临深伪色情和不良内容的问题，Civitai通过积极的内容监管和社区引导，努力在创新和安全之间找到平衡。Maier的经历也提醒我们，技术发展的同时，伴随着道德和法律问题的挑战。

CHAR观点：

Civitai的主页封面现已大为改观，显著提升了美观度。我深表赞同Justin Maier在内容监管方面的立场。这个平台无疑成为了众多AI炼丹爱好者的乐土。其开放性和多元化是这个社区最显著的特色，也是其最宝贵的财富。

Google推出强大新AI模型Gemini，对抗OpenAI

发布日期：2023年12月6日

引言：

Google最近推出了其备受期待的新人工智能模型Gemini，这一举措被视为对OpenAI的直接挑战。Gemini在AI领域的技术突破，可能成为Google在对抗OpenAI、Microsoft、Meta和Amazon等竞争对手的关键资产。

内容摘要：

Gemini的发布：Google的Gemini被认为是公司迄今为止最大规模且最具雄心的AI模型发布。
技术优势：据首席执行官Sundar Pichai表示，Gemini将极大地推动公司向创建能够像人类一样理解和推理世界的多功能AI助手迈进。
多元化应用：Gemini在多个方面表现卓越，能够在云端大型数据中心以及移动设备上高效运行。包括三种不同规模的版本：Gemini Ultra、Gemini Pro和Gemini Nano，应用于科研、数据分析、Google产品，以及智能手机等多种平台。
创新性能：Gemini在多项复杂推理测试中超越了人类专家，其在30多个标准化AI基准测试中取得了至今为止的最高分。
对行业的影响：Gemini的到来将为开发者和企业客户带来革命性的变化，提供新的、改进的AI工具，有可能彻底改变他们构建和规模化AI应用的方式。

分析评论：

Gemini的推出，不仅展示了Google在AI领域的技术实力，也预示了它在全球技术竞赛中的领导地位。这一模型的多模态和高级推理能力，可能会为依赖多格式数据分析的行业（如医疗保健、娱乐和自动驾驶）带来变革。此外，Gemini在编程领域的潜力表明，它可能显著简化软件开发过程，创造更复杂、高效的软件解决方案。

CHAR观点：

Gemini的问世，不仅仅是对CharGPT的挑战或超越，更是一种平衡力量。它防止了人类命运被少数集团所控制，为普通民众带来了一线利益平衡。哪怕只是微小的倾斜，也足以体现这种平衡的价值所在。

Reallusion发布iClone 8.4和Character Creator 4.4，带来革命性更新

发布日期：2023年12月6日

引言：

Reallusion最新发布的iClone 8.4和Character Creator 4.4为其实时角色动画软件和3D角色创建工具带来了重大更新。这些更新预计将极大提升CG创作者的工作效率和创作自由度。

内容摘要：

iClone 8.4重要更新：新增直观的人群模拟系统，以及对Motion Designer工具集的进一步更新。
Character Creator 4.4新增功能：增加对HumanIK配置文件的支持，改进内容管理器的搜索功能。
人群动画和模拟工具集：新散点工具可在3D场景中有效分布人群角色，支持导航网格和线性路径控制角色移动。
性能提升：角色可切换到精简模式以提高性能，支持DDS图像压缩减少加载时间。
价格和系统要求：iClone 8.4和Character Creator 4.4均适用于Windows 7及以上版本。新永久许可证分别为299美元和599美元。

分析评论：

这次更新将显著提升iClone和Character Creator的功能，特别是对于需要高效管理复杂场景和角色的CG艺术家来说。新的人群模拟和动画工具，以及更加高效的性能优化，将进一步巩固Reallusion在CG软件市场的领先地位。

CHAR观点：

iClone的使用体验正变得越来越类似于游戏，它虽然在专业与半专业之间摇摆，但在实际操作中，特别是在角色制作方面，其实用性和效率确实令人印象深刻。

Nevercenter发布Silo 2024.0和Milo 2024.0，引领3D建模新潮流

发布日期：2023年12月8日

引言：

Nevercenter最近发布了Silo 2024.0和Milo 2024.0，这两款软件分别是轻量级3D建模软件和基于Unreal Engine的实时渲染器，它们的更新预计将为3D建模和渲染带来新的变革。

内容摘要：

Silo 2024.0的新特性：引入了File Instance系统，这是一种引用外部文件的新方法，使管理和更新复杂模型变得更加容易。
Milo 2024.0的更新：添加了新的渐变背景类型，可用于创建天空背景或更具风格化的效果。该背景锁定在屏幕空间，使模型旋转时保持固定。
性能提升：这些更新使得Silo和Milo在操作和渲染方面更加高效。
系统要求和价格：Silo和Milo都适用于Windows 10和macOS 10.15及以上版本。Silo的永久许可证定价为159美元，包括Milo。在过去一年内购买软件的用户可以免费获得这些更新。

分析评论：

Nevercenter的这次更新，不仅提升了Silo和Milo的功能性，也为用户带来了更高效和便捷的3D建模及渲染体验。这些创新特性可能会吸引更多的CG艺术家和开发者，推动3D建模和渲染技术的进步。

CHAR观点：

在渲染和建模领域，未来的胜者将是那些能够最早有效地融合人工智能技术的先行者。谁能率先实现AI的深度整合，谁就有望在这场技术竞赛中领先一步。

感谢观看AIneon CG&AI 本周快讯。我们希望这些精选的新闻为您提供了深刻洞见和灵感。随着AI和CG领域的不断进步，我们将继续与您一起探索这个充满活力的技术世界。下周，更多激动人心的内容等待着您的关注。再次感谢，期待您的持续关注。

由 charzhang 2023年12月11日在 CG&AI Weekly News