《腾讯智影》PC端迎来创意升级：“智能画布”登场，支持再创作、抠图、消除、扩图等

时间：2024-07-26 17:08:54

编辑：001资源网

近日消息，腾讯智影PC版近期引入了“智能画布”新特性，该功能集成了先进的AI图像处理技术，为用户带来一系列高效图片编辑工具。它极大地方便了那些需对AI生成图像进行二次创作、精细抠图、元素移除、尺寸拓展等操作的用户，使图形设计工作流程更为顺畅自如。

用户可以通过智影首页的“智影小工具”找到“智能画布”功能，选择一个画布尺寸并上传图片。智影提供了多款预定尺寸，并允许用户根据需求自定义画布尺寸。上传的图片可以是用户自己上传的，也可以是AI绘画生成的图片。

在画布中，用户可以利用左侧边栏的工具进行图片编辑，包括添加文字、使用丰富的素材贴纸等。此外，智能画布还提供了AI绘画的文生图和图生图功能，允许用户直接在画布中进行AI创作。

智影的智能画布功能还包括以下图片AI调整功能：

图片裁剪：允许用户将图片裁剪成所需尺寸。

智能抠图：AI自动识别并抠图，或让用户选择特定部分进行抠图。

智能消除：去除图片中不想要的元素。智能扩图:对图片进行扩展，补全缺失部分。

局部重绘：对图片的局部区域进行重绘，如将背景元素替换。无损高清:对模糊的老照片进行高清翻新。

这些功能使得智影的智能画布成为一个强大的图片编辑和创作工具，适合各种创意和专业需求。用户现在可以登录智影首页，体验这些新功能。

腾讯智影小程序在7月9日迎来了一项创新升级，正式推出了智影AI视频特性。这一新功能让用户得以轻松创作个性化视频内容，仅需简单操作即可赋予视频独特的日漫风格，为视频作品增添一抹二次元的魅力。

《智影》小程序新玩法：AI魔法打造个性化视频，限时体验免费创作！

目前，该风格化处理服务正处于限时免费推广期，尽管未来可能采取收费策略，但具体的费用标准尚未公开透露。

视频风格化就是在原视频的基础上进行风格化处理，官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。

只需导入视频并一键“变身”，就能快速生成风格化视频（支持 10s 视频），智影 AI 提供了多种模板，让视频更加多样化。

据此前报道，腾讯智影上线于 2023 年 3 月，是一款集成了 AI 创作能力的智能创作工具，提供虚拟数字人、文本配音、智能去水印、文章转视频、模板创作、在线视频剪辑等功能。

1月5日消息，腾讯QQ官方旗舰店于今日在京东平台上线了全新款式的QQfamily头戴式蓝牙耳机产品。该耳机在音频协议上实现了显著升级，并提供黄、蓝、粉三种时尚色彩供消费者选择。目前这款耳机正处于预售环节中，其首发售价为168元人民币，不过购买时需另外支付8元的运费。

腾讯发布QQfamily新款头戴式蓝牙耳机，配备40mm动圈单元及20小时续航能力，首发价格仅168元

官方介绍称，这款头戴耳机配备 40mm 动圈单元，采用可折叠设计，一侧拥有实体触控按键，拥有 3.5mm 音频接口，支持 A2DP / HFP / HSP / AVRCP 协议。

续航方面，这款耳机配备 300 毫安时电池，单次充电需要 3.5 小时，可使用 20 小时。

腾讯发布QQfamily新款头戴式蓝牙耳机，配备40mm动圈单元及20小时续航能力，首发价格仅168元

近日消息，腾讯宣布其先进的文生图大模型——混元DiT，已正式开源其优化后的小显存版本。这一版本经过精心设计，只需6GB的显存便能流畅运行，极大地降低了硬件门槛，使得更多个人开发者和小型团队能够在自己的PC上进行模型部署和创新实验。

腾讯开源混元DiT文生图模型新版本：6G显存轻松驾驭，打标工具同步开放

此外，腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语，针对文生图场景进行专门优化，可帮助开发者快速制作文生图数据集。

腾讯混元 DiT 模型升级

腾讯混元 DiT 模型宣布了三大更新：推出小显存版本与 Kohya 训练界面，并升级至 1.2 版本，进一步降低使用门槛的同时提升图片质量。

基于 DiT 架构的文生图模型生成图片质感更佳，但对显存的要求却非常高，混元 DiT 因此推出小显存版本，最低 6G 显存即可运行优化推理框架，对使用个人电脑本地部署的开发者比较友好。

经过与 Hugging Face 合作，小显存版本、LoRA 与 ControlNet 插件，都已经适配到 Diffusers 库中。开发者无需下载原始代码，仅用三行代码仅可调用，简化了使用成本。

同时，混元 DiT 宣布接入 Kohya，让开发者可以低门槛地训练专属 LoRA 模型。

Kohya 是一个开源的、轻量化模型微调训练服务，提供了图形化的用户界面，被广泛用于扩散模型类文生图模型的训练。

用户可以通过图形化界面，完成模型的全参精调及 LoRA 训练，无需涉及到代码层面的细节。训练好的模型符合 Kohya 生态架构，可以低成本与 WebUI 等推理界面结合，实现一整套“训练-生图”工作流。

混元 Captioner

在提升模型易用性的同时，腾讯混元团队最新开源了打标模型 —— 混元 Captioner。

借助打标模型，开发者可以快速生成数据集。具体来说，文生图开发者将原始图片集导入混元 Captioner，后者将生成标注；也可以导入图片与原始描述，利用混元 Captioner 过滤其中的无关信息，并完善和优化图片描述，以提高数据质量。

目前，业界对于图片描述文本的生成，主要使用通用多模态 Captioner 模型，存在描述过于简单或繁琐（与画面描述的无关信息过多）、缺少背景知识导致无法识别知名人物和地标等问题，并且许多模型并非中文原生，中文描述不够精准。

Captioner 模型号称针对文生图场景专门进行优化：

构建了结构化的图片描述体系；

在模型层面，通过注入人工标注、模型输出、公开数据等多种来源提升 Caption 描述的完整性；

注入知名文学作品形象、地标、食物、动物、中国元素与知识等背景知识。