
快速识别视频中的人脸信息并支持定位出人物所在的视频帧画面,以及人脸所在区域。
特色功能
- 支持客户自定义人脸库。
- 存档媒资发起识别后,支持存储视频内人脸向量数据,方便下次快速定位人物所在画面,进行二次编辑。
基于腾讯各实验室在音视频编解码、深度学习以及编辑处理等多年技术积累,整合各大实验室的最新研究成果应用到视频处理场景中,为用户提供一站式视频 AI 理解和识别服务。
百万人脸数据库、海量视频标签,涵盖人物、风景、食物、建筑、动植物、场景等9大类,包含日常生活的各个信息维度,满足视频内容全方位标签化。
对外提供公有私有一体化、直播点播统一化的标准 REST API 接口,可与点播服务、COS 存储、第三方存储系统快速打通,便捷接入,自主调度切换。
支持检测直播、点播视频中的画面帧以及声音质量,涵盖花屏、黑边、马赛克、噪声等全方位13项检测类型,并提供主播视频整体质量检测评分辅助推荐更精准。
为广电客户提供专属私有化服务,将智眸视频分析能力部署在本地服务器,提供智能审核、智能识别、智能编辑等全套 AI 能力,并支撑新闻网、制作网、媒资系统等业务系统的运作。
官网申请接入,审核通过后将为您提供专属服务。
为广电客户提供专属私有化服务,将智眸视频分析能力部署在本地服务器,提供智能审核、智能识别、智能编辑等全套 AI 能力,并支撑新闻网、制作网、媒资系统等业务系统的运作。
官网申请接入,审核通过后将为您提供专属服务。
在线教育客户通过直播或点播接入智眸视频分析服务,为客户提供视频审核、内容识别、知识拆条等能力,并将处理后的视频分发到客户平台或腾讯云平台。
官网申请接入,审核通过后通过控制台或 API 调用服务。
• 提升学习效率:基于万亿级图谱对知识进行关联,构建知识网络,提升学习效率。
• 高效内容定位:通过对视频内容的深度理解,快速定位相关视频内容。
• 资源保护:为版权内容提供数字水印,保护独有资源的版权。
用户上传音视频文件,智眸视频分析对音视频文件进行智能审核,解析文件中的物体、场景等元素,并提供精彩集锦、片头片尾等高效编辑能力,最终通过CDN分发到客户平台。
官网申请接入,审核通过后通过控制台或API调用服务。
直播用户通过推流接入智眸视频分析服务,对直播流实时审核,识别直播流中的人脸、语音等元素,并为直播流生成精彩集锦、封面等,最终通过 CDN 将直播流分发给观众。
官网申请接入,审核通过后通过控制台或 API 调用服务。
快速识别视频中的人脸信息并支持定位出人物所在的视频帧画面,以及人脸所在区域。
快速识别视频中的人脸信息并支持定位出人物所在的视频帧画面,以及人脸所在区域。
快速识别视频中的声音并转化成文字(普通话、英文等),并且支持客户自定义关键词且定位出关键词所在视频的时间点,支持实时流语音识别分析。
立足于腾讯庞大的社交数据平台,积累了数十万小时的语音标注数据,拥有丰富多样的语料库,为高识别率奠定数据基础。
基于多种序列神经网络结构(LSTM、Attention Model、DeepCNN),采用 Multitask 训练方法,结合T/S方式,在通用以及垂直领域有业内领先的识别精度。
现阶段已经支持中文普通话、英语、粤语和韩语语音识别,后续将陆续开放其他语种或方言的识别能力。
语音识别模型鲁棒性佳,识别精度高,抗噪声的干扰能力强,能够识别来自嘈杂环境的音频信息,不需要客户进行降噪处理。
经过微信、腾讯视频、王者荣耀等内部业务充分验证,也在大量互联网、金融、教育等领域的外部客户业务场景成功落地,日服务亿级用户,性能稳定。
快速识别视频中出现的文字信息(简体、繁体、英文等),可用于视频内的自定义关键词的提取,也支持竖版文字的识别。支持客户自定义关键词且定位出关键词所在视频的时间点。
支持自动识别语言类型,同时支持自选语言种类(推荐),除中英文外,支持日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。
印刷文档识别、网络图片识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、头像文字识别等。
支持多场景、任意版面下整图文字中的手写中文、英文、字母、数字、常见字符的识别。针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。
支持自定义视频截帧间隔,自动识别截帧画面内的标签,并定位标签所在的视频位置。帧标签涵盖人物、风景、人造物、建筑、动植物、食物等 9 个大类,包含日常生活的各个信息维度。
默认1秒识别一帧视频画面,公有云接口最小可设置 500毫秒识别一帧,私有化接口支持自定义。
识别完的视频标签入库后,可支持快速检索和定位到视频帧画面内容,方便进行二次的剪辑工作。
可支持根据客户业务场景需求定制标签体系。
微信看一看产品,使用视频标签后,为推荐机制赋能,实现平台推荐效率的全面提升,极大节省了人工运营成本。
视频内容多维度结构化分析,结合视频场景、语音及文字信息,对视频智能拆条。支持新闻、广告等。
完整的新闻节目包含多段新闻片段,可使用智能拆条智能化将整段的新闻拆散成多个新闻片段,方便入库和再利用
可根据客户业务场景进行拆条定制。
基于视频时域、空域特征匹配、场景识别、目标检测等技术自动生成视频精彩片段,支持足球、蓝球、绝地求生、王者荣耀等多种视频场景。
依托腾讯游戏丰富的视频训练样本和多媒体实验室与鹏城实验室联合开发的赛事集锦模型,实现高效的游戏和体育智能集锦生产。
可支持根据客户业务场景定制智能集锦。
结合视频画面纹理、场景识别、目标检测等特征信息自动生成视频封面,支持静态和动态封面输出,提升视频封面体验和点击转化率。
辅助短视频平台快速生成 GIF 视频动图封面,提升客户点击率,带来更好的口碑。
帮助海量短视频自动产生符合美学的封面图,可极大节省编辑的运营成本。
自动识别片头片尾后,可快速定位广告插入的时间点,辅助平台提升营销运营效率。
将水印图以不可见的形式编码到视频流中,同时不影响视频质量。在视频被盗取后,可对疑似被盗取的资源进行盲水印提取,验证视频归属。
对视频再次剪裁、拼接后,数字水印仍然有良好的可抗性。
提供检测数据水印的软件工具,可便于平台检测数据水印的效果。
针对广电场景,在媒资生产、媒资归档以及人工审核环节提供准确高效的视频智能服务,支持私有化部署与公有云两种交付形式。
可高效生成视频素材的多维度标签(人脸、语音、文字、帧标签、目标检测等),是影像资料馆等媒资素材再利用的最佳服务工具,能让编辑等相关人员快速定位和检索所需视频素材。
可对长、短视频以及直播流进行音画字的多维安全审核。人物库标准与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。
提供快编解决方案,并结合视频智能,快速生成新闻拆条、游戏及体育赛事等集锦。
针对广电场景,在媒资生产、媒资归档以及人工审核环节提供准确高效的视频智能服务,支持私有化部署与公有云两种交付形式。
可高效生成视频素材的多维度标签(人脸、语音、文字、帧标签、目标检测等),是影像资料馆等媒资素材再利用的最佳服务工具,能让编辑等相关人员快速定位和检索所需视频素材。
可对长、短视频以及直播流进行音画字的多维安全审核。人物库标准与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。
提供快编解决方案,并结合视频智能,快速生成新闻拆条、游戏及体育赛事等集锦。
针对教育视频中的知识点,利用知识图谱进行内容关联,建立结构化知识模型,对知识点进行拆条,并提供版权保护方案,有效保护视频的安全性。
通过知识图谱对视频内容与知识点进行关联,构建知识关联网络,提升学习效率。
通过模型训练,对教学内容中的知识点进行智能拆条,形成单一的知识点讲解视频。
智能添加隐形水印,防止内部资源被盗用。
解析在线视频中的人脸、语音、标签等信息,智能生成视频的精彩集锦、片头片尾、封面等,提升视频编辑效率,优化资源库可用性。
通过对视频内容的深度理解,为视频进行深层次的内容编目,提升媒资系统的检索可用性。
通过海量视频训练,智能识别视频的片头片尾,减少生产工作量。
可对长、短视频以及直播流进行音画字的多维安全审核。人物库标准与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。
通过对直播内容的多维度识别,快速输出场景等标签辅助推荐,并支持大客户的标签定制训练服务。
通过对主播跳舞/歌唱等行为识别,快速输出标签帮助平台推荐算法提升推荐效率。
可对长、短视频以及直播流进行音画字的多维安全审核。人物库标准与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。
关于使用场景和技术架构的更多咨询, 请联系我们的销售和技术支持团队。