《腾讯智影》PC端迎来创意升级:“智能画布”登场,支持再创作、抠图、消除、扩图等

时间:2024-07-26 17:08:54
编辑:001资源网

近日消息,腾讯智影PC版近期引入了“智能画布”新特性,该功能集成了先进的AI图像处理技术,为用户带来一系列高效图片编辑工具。它极大地方便了那些需对AI生成图像进行二次创作、精细抠图、元素移除、尺寸拓展等操作的用户,使图形设计工作流程更为顺畅自如。

《腾讯智影》PC端迎来创意升级:“智能画布”登场,支持再创作、抠图、消除、扩图等

用户可以通过智影首页的“智影小工具”找到“智能画布”功能,选择一个画布尺寸并上传图片。智影提供了多款预定尺寸,并允许用户根据需求自定义画布尺寸。上传的图片可以是用户自己上传的,也可以是AI绘画生成的图片。

在画布中,用户可以利用左侧边栏的工具进行图片编辑,包括添加文字、使用丰富的素材贴纸等。此外,智能画布还提供了AI绘画的文生图和图生图功能,允许用户直接在画布中进行AI创作。

智影的智能画布功能还包括以下图片AI调整功能:

图片裁剪:允许用户将图片裁剪成所需尺寸。

智能抠图:AI自动识别并抠图,或让用户选择特定部分进行抠图。

智能消除:去除图片中不想要的元素。智能扩图:对图片进行扩展,补全缺失部分。

局部重绘:对图片的局部区域进行重绘,如将背景元素替换。无损高清:对模糊的老照片进行高清翻新。

这些功能使得智影的智能画布成为一个强大的图片编辑和创作工具,适合各种创意和专业需求。用户现在可以登录智影首页,体验这些新功能。

《智影》小程序新玩法:AI魔法打造个性化视频,限时体验免费创作!

腾讯智影小程序在7月9日迎来了一项创新升级,正式推出了智影AI视频特性。这一新功能让用户得以轻松创作个性化视频内容,仅需简单操作即可赋予视频独特的日漫风格,为视频作品增添一抹二次元的魅力。

《智影》小程序新玩法:AI魔法打造个性化视频,限时体验免费创作!

目前,该风格化处理服务正处于限时免费推广期,尽管未来可能采取收费策略,但具体的费用标准尚未公开透露。

视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。

只需导入视频并一键“变身”,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。

据此前报道,腾讯智影上线于 2023 年 3 月,是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人、文本配音、智能去水印、文章转视频、模板创作、在线视频剪辑等功能。

腾讯发布QQfamily新款头戴式蓝牙耳机,配备40mm动圈单元及20小时续航能力,首发价格仅168元

1月5日消息,腾讯QQ官方旗舰店于今日在京东平台上线了全新款式的QQfamily头戴式蓝牙耳机产品。该耳机在音频协议上实现了显著升级,并提供黄、蓝、粉三种时尚色彩供消费者选择。目前这款耳机正处于预售环节中,其首发售价为168元人民币,不过购买时需另外支付8元的运费。

腾讯发布QQfamily新款头戴式蓝牙耳机,配备40mm动圈单元及20小时续航能力,首发价格仅168元

官方介绍称,这款头戴耳机配备 40mm 动圈单元,采用可折叠设计,一侧拥有实体触控按键,拥有 3.5mm 音频接口,支持 A2DP / HFP / HSP / AVRCP 协议。

续航方面,这款耳机配备 300 毫安时电池,单次充电需要 3.5 小时,可使用 20 小时。

腾讯发布QQfamily新款头戴式蓝牙耳机,配备40mm动圈单元及20小时续航能力,首发价格仅168元

腾讯开源混元DiT文生图模型新版本:6G显存轻松驾驭,打标工具同步开放

近日消息,腾讯宣布其先进的文生图大模型——混元DiT,已正式开源其优化后的小显存版本。这一版本经过精心设计,只需6GB的显存便能流畅运行,极大地降低了硬件门槛,使得更多个人开发者和小型团队能够在自己的PC上进行模型部署和创新实验。

腾讯开源混元DiT文生图模型新版本:6G显存轻松驾驭,打标工具同步开放

此外,腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作文生图数据集。

腾讯混元 DiT 模型升级

腾讯混元 DiT 模型宣布了三大更新:推出小显存版本与 Kohya 训练界面,并升级至 1.2 版本,进一步降低使用门槛的同时提升图片质量。

基于 DiT 架构的文生图模型生成图片质感更佳,但对显存的要求却非常高,混元 DiT 因此推出小显存版本,最低 6G 显存即可运行优化推理框架,对使用个人电脑本地部署的开发者比较友好。

经过与 Hugging Face 合作,小显存版本、LoRA 与 ControlNet 插件,都已经适配到 Diffusers 库中。开发者无需下载原始代码,仅用三行代码仅可调用,简化了使用成本。

同时,混元 DiT 宣布接入 Kohya,让开发者可以低门槛地训练专属 LoRA 模型。

Kohya 是一个开源的、轻量化模型微调训练服务,提供了图形化的用户界面,被广泛用于扩散模型类文生图模型的训练。

用户可以通过图形化界面,完成模型的全参精调及 LoRA 训练,无需涉及到代码层面的细节。训练好的模型符合 Kohya 生态架构,可以低成本与 WebUI 等推理界面结合,实现一整套“训练-生图”工作流。

混元 Captioner

在提升模型易用性的同时,腾讯混元团队最新开源了打标模型 —— 混元 Captioner。

借助打标模型,开发者可以快速生成数据集。具体来说,文生图开发者将原始图片集导入混元 Captioner,后者将生成标注;也可以导入图片与原始描述,利用混元 Captioner 过滤其中的无关信息,并完善和优化图片描述,以提高数据质量。

目前,业界对于图片描述文本的生成,主要使用通用多模态 Captioner 模型,存在描述过于简单或繁琐(与画面描述的无关信息过多)、缺少背景知识导致无法识别知名人物和地标等问题,并且许多模型并非中文原生,中文描述不够精准。

Captioner 模型号称针对文生图场景专门进行优化:

构建了结构化的图片描述体系;

在模型层面,通过注入人工标注、模型输出、公开数据等多种来源提升 Caption 描述的完整性;

注入知名文学作品形象、地标、食物、动物、中国元素与知识等背景知识。

相关攻略
相关推荐