
注:本图为DALL.E根据本文内容生成
本周CG和AI领域迎来了一连串引人注目的事件,从微软推出高效的Orca 2模型,NVIDIA报告AI需求的飙升,到OpenAI内部的动荡,Adobe收购Rephrase以加强其创意云,Stability AI进入视频生成市场,Blender遭受重大网络攻击,以及Marvelous Designer带来的创新设计体验。这些动态不仅展示了技术的快速进展,也标志着行业面临的转折点和挑战。
▶▶▶Pika Labs融资5500万美元,推出新AI视频平台,挑战Runway
原文链接:VentureBeat 发布日期:2023年11月28日
引言:
Pika Labs,一家成立仅六个月的视频AI初创公司,宣布完成了5500万美元的融资,并推出了新的AI视频平台Pika 1.0,直接竞争Runway和其他领先企业。
内容摘要:
- 创新平台:Pika 1.0是一个基于网络的平台,用户可以仅通过文本提示生成和编辑多样风格的视频,包括3D动画、动漫或电影风格。
- 显著增长:公司宣布已经吸引了超过50万用户,其产品被广泛用于创造视频内容。
- 竞争对手:Pika Labs的竞争对手包括Runway、Stability AI和Adobe,这些公司也在AI驱动的视频生成领域进行探索和开发。
- 市场潜力:Pika Labs的成功融资及其在视频AI领域的快速发展,预示着公司在这个日益热门的市场中的重要地位。
分析评论:
Pika Labs的这一举措不仅是对现有视频制作过程的革命,也是对视频内容创作民主化的一次重要尝试。它的成功表明了AI技术在视频制作和编辑方面的巨大潜力,预示着未来视频内容创作可能会更加便捷和个性化。
▶CHAR观点:
经过自己的实际测试,Pika1.0确实在某些镜头效果上优于Runway,但距离传统CG动画还是有相当大的一段距离。无论是从摄像机的运动路径和动画元素的运动方式都还有很大的提升空间。但AI动画领域都是指数级增长,谁知道下个月会进化成什么样。拭目以待。另外八卦一下,看了这两位女学霸创业者的履历,着实让人瑟瑟发抖。
▶▶▶新技术通过忽略不相关的信息帮助LLM提高推理能力
原文链接: VentureBeat 发布日期: 2023年11月28日
引言:
Meta研究人员开发的新技术“System 2 Attention”(S2A)显著提升了大型语言模型(LLM)的推理能力,通过忽略不相关的信息,提高了模型的准确性和效率。
内容摘要:
- S2A技术基于心理学研究,能够准确地修正用户的提示,消除误导性或不相关的信息。
- 这项技术使LLM在问答和推理任务中表现更准确,有助于提高可靠的推理能力。
- S2A改进了LLM处理信息的方式,尤其是在处理包含个人观点或不相关内容的提示时。
- 这种技术模仿了人类的“系统2思维”,即慢速、深思熟虑和分析性思维,与直觉和自动的“系统1思维”相对。
分析评论:
S2A技术的开发标志着LLM在处理复杂问题和进行高级推理方面的一大步进。这种方法能够减少模型在回答问题时的偏差,从而提供更准确、更客观的回答。然而,这种技术也增加了生成任务的成本,并且仍存在改进空间。
▶CHAR观点:
近未来可能是定制化模型占主导地位。
▶▶▶德勤发布2024年全球科技、游戏和娱乐行业预测
原文链接:VentureBeat 发布日期:2023年11月29日
引言:
德勤针对2024年的科技、游戏和娱乐市场发布了全球预测,特别关注生成式人工智能(Generative AI)对多个行业的重塑作用。
内容摘要:
- 流媒体变革:流媒体服务将通过增加定价层级来满足不同消费者需求,应对用户流失,预计将实现盈利性增长。
- 生成式 AI 的应用:预计2024年几乎所有企业软件都将集成生成式 AI,企业软件公司预计收入将增长至100亿美元。
- 可持续性挑战:科技、电信和半导体行业在增长的同时面临可持续性挑战,预计电信行业的碳足迹将减少2%。
- 女性体育的增长:女性体育在2024年预计将突破十亿美元收入大关,显著增长。
分析评论:
德勤的预测揭示了2024年全球科技、游戏和娱乐行业的关键趋势。特别是生成式 AI,预计将成为企业软件的重要组成部分,推动产业创新和收入增长。同时,流媒体服务的变革和女性体育的增长也将成为行业的亮点。这些预测不仅展示了技术进步的潜力,也突显了行业在可持续性和平等性方面的发展。
▶CHAR观点:
随着生成式人工智能(AI)的日益普及,促使人人都使用上AI似乎成为了接下来的一大风口。这不仅意味着技术的普及化,也预示着AI将深刻影响我们的生活和工作方式。
▶▶▶Perplexity AI 推出具有最新知识的在线 LLM
原文链接:VentureBeat 发布日期:2023年11月29日
引言:
Perplexity AI 成功推出了融合网络索引和最新信息的对话式 AI 聊天机器人界面,这可能会改变当前网络搜索的格局。
内容摘要:
- Perplexity AI 是由前谷歌 AI 研究人员创立的初创公司,其聊天机器人 Perplexity Copilot 至今使用了 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为其智能支持。
- 最近,公司推出了自己的大型语言模型 (LLM) —— pplx-7b-online 和 pplx-70b-online,分别基于 70 亿和 700 亿参数的开源模型 mistral-7b 和 llama2-70b。
- 这些模型特别因能提供“有用的、事实的和最新的信息”而备受关注,这是大多数其他领先 LLM 所难以实现的。
- Perplexity 的新 LLM 目标是成为网络搜索的首选目的地,通过其 API 向其他组织和应用开发者提供服务。
分析评论:
Perplexity AI 的新模型在提供最新信息和事实上展示了明显的优势,预示着 AI 在网络搜索领域的重大突破。随着这些模型的出现,可能对传统的搜索引擎如 Google 搜索造成挑战,开启网络信息检索的新时代。
▶CHAR观点:
定制化搜索,甚至是私人AI助理,是普通人变成亚人的必经之路。这一进步不仅展示了 AI 技术的发展,还突出了其在实时信息获取和处理方面的潜力,预示着网络搜索将朝向更智能、更个性化的方向发展。
▶▶▶亚马逊推出 Titan 图像生成 AI:您需要了解的内容
原文链接:VentureBeat 发布日期:2023年11月29日
引言:
亚马逊在其 re:Invent 大会上宣布推出名为 Titan Image Generator 的图像生成人工智能(AI),这一举措使亚马逊加入了从文本提示创建原创图像和艺术作品的科技巨头行列。
内容摘要:
- Titan Image Generator 是亚马逊 Titan AI 服务套件的一部分,通过 Amazon Web Services (AWS) 的 Bedrock 提供。
- 该系统允许用户提供文本提示来生成原始图像,并能够编辑现有图像,比如更改或移除背景。
- Titan Image Generator 不作为独立的应用或服务发布,而是设计为开发者工具,用于构建由该模型驱动的应用程序,直接针对企业用户。
- 该工具具有内置的偏见防护措施,并在所有图像上附加不可见水印,以标识它们为 AI 生成。
分析评论:
亚马逊的 Titan Image Generator 表明该公司在 AI 图像生成领域的新战略方向。通过提供强大的工具和法律保障,亚马逊有望在 AI 图像生成和使用领域产生重大影响。该技术的发展可能会催化 AI 驱动内容创作中的新应用。
▶CHAR观点:
巨头的算力优势永远是AI时代最大的优势。
▶▶▶Stability AI 借助 SDXL Turbo 加速文本到图像的生成
原文链接:VentureBeat 发布日期:2023年11月29日
引言:
Stability AI 使用新技术,大幅提升了从文本提示生成图像的速度,标志着 AI 领域的一个重要进步。
内容摘要:
- Stability AI 采用的新方法显著加快了 AI 从文本生成图像的速度,大幅减少了以往所需的步骤数量和计算负载。
- 其中的关键技术是对抗性扩散蒸馏(ADD),这种技术并非基于更快的硬件,而是一种新的生成方法。
- SDXL Turbo 模式以高度详细的结果为特点,其图像质量仅略低于非加速版本的 SDXL,几乎不涉及品质与速度的权衡。
- 尽管目前 SDXL Turbo 模型尚未准备好用于商业用途,但它已在 Stability AI 的 Clipdrop 网络服务上提供预览版。
分析评论:
Stability AI 的 SDXL Turbo 表明,AI 领域正在以更高的速度和更低的资源需求向实时图像生成迈进。该技术可能会对内容创作、设计和媒体产业产生深远影响,开创新的应用和商业模式。
▶CHAR观点:
SDXL Turbo已经让我们这些所谓专业的CG人已经无法轻易辨识出AI生成还是真的照片。
▶▶▶再见了,平面设计师?COLE 按需生成设计
原文链接:VentureBeat 发布日期:2023年11月30日
引言:
AI技术的发展正在重塑平面设计行业。最新的AI系统COLE可以按需生成可编辑的设计,对平面设计师的传统工作方式构成潜在挑战。
内容摘要:
- AI系统COLE:由Microsoft Research Asia和北京大学的研究团队合作开发,结合了Meta的多个AI模型,如Llama2-13B、DeepFloyd IF、LLaVA1.5-13B和GPT-4V,以及开源图形渲染器Skia。
- 功能和优势:COLE能够根据用户输入的设计项目想法生成图形和文本,特别擅长处理.SVG文件,生成具有清晰结构和可编辑文本的图形设计。与现有的文本到图像生成器如DALL-E 3或Midjourney相比,COLE在生成具有可编辑元素的设计方面显示出竞争力。
- 应用前景:COLE的研发不仅提供了一种新的平面设计生成方式,还可能对平面设计师的职业生涯产生深远影响。
分析评论:
COLE的问世预示着平面设计行业的一次重大变革。尽管AI技术在设计生成方面展现出潜力,但真正的创造力和艺术感觉仍需人类设计师提供。COLE可作为设计师的辅助工具,而非取代者。这项技术的发展既带来了机遇,也带来了挑战。
▶CHAR观点:
彻底代替设计师确实有点危言耸听,但是未来的强人工智能就不好说了,希望慢点到来。强AI的发展可能给平面设计领域带来根本性的变革,但同时也应保留人类独有的创造力和审美。
▶▶▶Otoy 公布 Octane 2024 产品路线图
原文链接:CG Channel 发布日期:2023年11月28日
引言:
Otoy近日公布了Octane 2024的产品路线图,揭示了其GPU生产渲染器和Octane X macOS以及iOS版本在2024年将引入的新功能。
内容摘要:
- 多平台网络渲染:在OctaneRender 2024.1的初始alpha版本中已支持。
- 即将加入的新功能:包括对MaterialX的支持、新的AI助手OctaneGPT、光场烘焙和Brigade时间降噪器。
- 2024.x版本的新增功能:神经渲染、多重渲染和新的体积实时合成器。
- 新的几何体管线:统一了CUDA和Metal之间用于几何图形的内存布局,允许在渲染网络中混合使用Mac、Windows和Linux机器。
- NVIDIA GPU的优化:新管线扩展了OctaneRender在NVIDIA GPU中对RT核心的使用,提升了渲染性能。
分析评论:
OctaneRender 2024的产品路线图展现了Otoy在渲染技术领域的创新和领导地位。特别是结合AI技术和传统渲染工具的尝试,标志着行业朝向更高效、智能化的渲染解决方案的转变。这些新功能有望提升CG艺术家和专业人士的工作效率和创造力。
▶CHAR观点:
最让我关注的是Octane渲染器引入AI的部分,个人认为这将是传统CG软件巨头们拉开差距的关键节点。 AI技术的融合预示着渲染技术的重大变革,对整个CG行业来说是一个激动人心的进步。
▶▶▶索尼在DMPC开设虚拟制作实验室,展示高端小批量LED技术
原文链接:fxguide 发布日期:2023年12月1日
引言:
索尼最近在其位于加州洛杉矶的数字媒体制作中心(DMPC)开设了一家新的虚拟制作实验室。这一设施提供了一个独特的机会,让制片经理、电影摄影师和其他客户能够测试索尼的专业电影设备,包括被广泛用于电影制作的旗舰型VENICE 2电影摄影机。
内容摘要:
- 多功能直视LED(dvLED)视频墙:作为传统绿幕的替代品,用于虚拟制作测试和验证,由Peerless-AV设计和安装的定制安装基础设施支持。
- 索尼的Crystal LED展示:使用Peerless-AV的Seamless Kitted dvLED安装系统,展示其虚拟制作工具,包括高端dvLED电影摄影机、监视器和基础设施解决方案。
- 小型LED体积的有效性:展示了小型LED体积如何有效地用于小规模应用,例如电影学院。
- 挑战和解决方案:团队面临的主要挑战是有效利用有限空间,而不影响体验。经过多次迭代,确定了一个含有平面和轻微曲面的多面视频墙,以便于创意测试。
- 视频墙设计:视频墙的曲面侧设计用于消除色偏并确保图片一致性。
- 安装时间和规模:安装框架耗时五天,索尼Crystal LED机柜安装又需五天。视频墙由162个Crystal LED 8系列机柜组成,像素间距1.58毫米。
- 系统规格:总体系宽18机柜、高9机柜,分辨率为6912px x 1944px,超过13M像素,高于1.5倍4K分辨率。
- 展示活动:在DMPC内虚拟制作实验室的盛大开幕活动中展示了dvLED视频墙,包括新的测试和培训阶段的揭幕。
分析评论:
索尼在虚拟制作领域的这一举措不仅展示了其技术领先优势,也预示了未来影视制作的发展方向。虚拟制作的高端小批量LED技术将为内容创造者、专业摄影师和高级摄像操作员等提供更灵活、高效的工作环境,这对整个行业来说是一个重要的技术进步。
▶CHAR观点:
轻量化、模块化的LED屏幕是小团队的生产利器。希望有更好的支持灵活模块化的软件系统问世,以便充分利用这种先进技术。
感谢观看AIneon CG&AI 本周快讯。我们希望这些精选的新闻为您提供了深刻洞见和灵感。随着AI和CG领域的不断进步,我们将继续与您一起探索这个充满活力的技术世界。下周,更多激动人心的内容等待着您的关注。再次感谢,期待您的持续关注。