新闻动态
把握时代脉搏 引领行业发展
AI赋能大小屏统一智能运营和全渠道营销
2024-10-10 10:14
电视大屏已经进入大小屏统一智能运营和全渠道营销的平台竞争阶段,增长由每单位内容和每个客户的货币化能力驱动。生成式AI赋能大小屏统一智能运营,一是赋能搜索引擎和推荐引擎,包括搜索生成(RAG检索增强生成)、推荐生成(推荐+AIGC)和AI增强元数据;二是赋能电视交互创新,包括AI搜索和AI管家(AI Voice Agent)。大小屏统一智能运营结合全渠道营销,形成内外循环两个交易闭环:大屏视频消费(内容价值,垂直整合)和小屏生活消费(入口价值,连接生态),打造全省统一的AI交互入口和生活方式捆绑服务。
 
流媒体战争进入平台竞争的时代
《元宇宙》畅销书作家、前流媒体高管马修·鲍尔 (Matthew Ball),在名为《流媒体之书》(The Streaming Book)的线上迷你书中,阐述了媒体竞争的浪潮,我们在流媒体战争中的位置、过去和未来。媒体竞争经历三个浪潮:浪潮1:基于访问的竞争,“成为将内容传输给消费者的最佳方式”;随着访问的商品化,进入到浪潮2:基于内容的竞争,“为消费者制作最佳内容”;随着内容的饱和,进入到浪潮3:基于平台的竞争,“保持并最大化消费者的价值”;最后通过新的访问创新进行重启,周而复始。从广播电视,到有线电视,再到流媒体,目前我们所处的流媒体战争,正在进入基于平台的竞争。
媒体竞争的浪潮:从基于访问的竞争,到基于内容的竞争,再到基于平台的竞争,周而复始
 
浪潮 1:基于访问的竞争
定义问题:“成为将内容传输给消费者的最佳方式”
定义特征:
由访问或定价方面的创新启动;
主要通过新市场进入者引领;
竞争强度有限,专注于蚕食旧模式;
分销商主导经济;
增长由分销策略+认知驱动;
持续的商业模式/内容/设备实验和发现。
 
浪潮2:基于内容的竞争
定义问题:“为消费者制作最佳内容”
定义特征:
由访问创新的商品化引发;
旧领导者转向新的访问模式;
竞争强度高,专注于直接市场份额竞争;
分销商经济下滑;内容利润激增;
增长由优质内容驱动。
 
浪潮3:基于平台的竞争
定义问题:“保持并最大化消费者的价值”
定义特征:
由内容饱和引发;
市场开始排挤较小的参与者;
通过捆绑和包装不断增加市场力量的集中度;
单个类别的利润受到挤压;
增长由每单位内容和/或每个客户的货币化能力驱动。
 
电视的发展史,从访问(传输或分发)模式的技术创新开始,其竞争经历从访问到内容的转变和从内容到平台的转变。从1925年第一台电视机问世,除了电视机本身随着显示技术而进步(从黑白到彩色,从电子管、晶体管到集成电路,从CRT到LCD和OLED,分辨率从标清、高清到超高清4K和8K),传输技术(从广播电视,到有线电视,再到流媒体)为电视带来变革和繁荣。
广播电视技术(Broadcasting)为电视带来第一波普及和繁荣,观众通过天线接收地面电视台信号,电视台的核心收入是广告。地面电视时代,受覆盖范围所限,电视台的内容竞争强度有限,但随着卫星电视和有线电视的普及,电视台的内容竞争开始加剧。广播电视的线性频道和单向传播的特点,限制了电视台从内容进入平台竞争的能力。
有线电视技术(Cable)为电视带来第二波普及和繁荣,消费者所能收看的频道从最初的几个发展到上百个,还支持回看和点播,商业模式从广告扩展到了付费频道和付费点播。电视台为了收视和广告份额,开始进入优质内容的竞争,与此同时,开始出现付费频道,如美国的家庭票房HBO(Home Box Office)和国内的央视3568频道,电视进入多频道付费电视时代。有线电视运营商采取捆绑(Bundling)策略,打包销售包括新闻、体育、电影、电视剧、少儿、综艺、纪录片等在内的上百个频道以及点播内容,并在转型为包括宽带和移动通信的综合服务商的过程中,逐步加强自身的平台能力。
流媒体技术(Streaming)为电视带来第三波普及和繁荣,互联网开启了流媒体服务的新时代(YouTube成立于2005年,Netflix于2007年推出流媒体服务),电视开始逐渐“解绑”(Unbundling),以YouTube、Netflix、Prime Video、Hulu、Disney+、Max、Paramount+等为代表的直达消费者DTC(Direct To Consumer)视频服务迅速崛起。流媒体娱乐正在取代线性电视,流媒体娱乐是按需、个性化的,并且可以在任何屏幕上使用。流媒体的商业模式:Freemium(免费增值模式)=订阅会员(内容价值)+广告电商(流量价值),将是订阅视频点播SVOD(Subscription VOD)、广告视频点播AVOD(Ad-supported VOD)、单片付费TVOD(Transactional VOD)/PVOD(Premium VOD)、流媒体线性电视FAST(Free Ad-supported Streaming TV)并存的模式。随着内容竞争的加剧,流媒体世界变得越来越支离破碎,消费者面临割裂的流媒体服务体验,因此出现电视的“再捆绑”(Rebundling)趋势和“超级聚合”(Super-Aggregation)平台。超级聚合平台,一方面为消费者带来统一的内容发现、计费和观看体验,另一方面为内容方带来消费者,降低获客成本,减少订户流失。
电视的发展,经历了捆绑(有线电视)、解绑(流媒体),如今到了再捆绑(超级聚合)的阶段。目前超级聚合的扮演者有三大类:第一类是设备制造商(智能电视厂商如三星、媒体播放器厂商如Roku),所有这些公司销售的设备都可以成为超级聚合和捆绑销售的统一入口;第二类是流媒体平台商(视频服务商如Google TV/YouTube,Amazon Prime Video),为消费者提供统一的视频聚合和观看平台,Amazon Prime Video通常与Prime会员服务捆绑在一起,还包括如免费送货、在线音乐和一些其他的福利;第三类是运营商(付费电视运营商),Comcast就定位为“超级聚合商”(Supper-aggregator或Aggregator of aggregators),运营商作为付费电视和宽带服务提供商,在内容聚合和获客成本方面具备天然优势。
中国电视市场,呈现DVB(有线电视)、IPTV、OTT(互联网电视)三足鼎立之势。得益于三网融合政策和捆绑销售策略,IPTV用户规模已达4亿户,而有线电视运营商即中国广电,获得了宽带和5G牌照,成为继中国移动、中国电信、中国联通之后的第四大运营商。从长远来看,DVB、IPTV和OTT的发展将会是一个融合的过程,将成为一种以超级聚合平台为基础的综合服务生态,实现线性直播和非线性点播共存,流媒体单播形式和广播/组播形式共存,但会以个性化点播和流媒体播出为主。视频行业将演变为一种混合方式,广播(Broadcasting)和流媒体(Streaming)越来越多地融合到单一、统一的用户体验中,新的统一搜索、智能推荐和社交发现将取代传统的EPG电子节目指南,进入“增长由每单位内容和/或每个客户的货币化能力驱动”的平台竞争时代。
 
电视的观众在哪里?
《好莱坞报道》(The Hollywood Reporter)在”电视收视率路线图:流媒体时代观众观看的地点、时间和方式”(The TV Ratings Road Map: Where, When and How Viewers Watch in the Streaming Era)一文中解答了流媒体时代电视的观众在哪里。
电视的观众在哪里:当天(直播频道):40-50%;DVR(7天回看):20-25%;流媒体(点播):30-40%。
曾经是电视台和广告商的标准的直播首日观看,现在比以往任何时候都不太能说明大多数节目(体育、其他直播活动和新闻除外)的成功。流媒体还几乎无限期地延长了任何一集电视节目的寿命,媒体公司正在衡量(偶尔也会吹捧)那些长尾观众。源自线性电视的剧情片和喜剧片在7天观众中有很大一部分来自流媒体——通常比来自 DVR 回放的观众更多。
1)Same-Day Ratings当天收视率:直播频道占比40-50%
任何在节目播出当晚观看节目的人,无论是现场观看,还是在当地时间第二天凌晨3点之前(尼尔森24小时时段的截止点),都会被计入当天收视率。然而,这些人在节目总观众中所占的比例稳步下降。体育直播和新闻节目是这一规则的一大例外。
2)DVR Use DVR的使用:7天回看占比20-25%
DVR回放在节目跨平台7天观众中所占的比例有所下降,约为20%至25%。
3)Streaming流媒体:点播占比30-40%
流媒体在美国电视收视中所占份额最大。然而,没有一个流媒体平台对观看其节目的人数完全透明(Netflix从2023年开始每年发布两次《我们观看了什么:Netflix参与度报告》)。
尽管大多数广播观众仍然通过更古老的方式观看——在设定的时间打开电视,或在下周使用DVR——但流媒体播放占7天总播放量的30%至40%(有时甚至更多)。
电视的观众在哪里:当天(直播频道):40-50%;DVR(7天回看):20-25%;流媒体(点播):30-40%
 
尼尔森(Nielsen)The Gauge美国电视收视数据:
2022年7月,流媒体首次超过有线电视,占据最大的电视收视份额。流媒体在电视总消费中所占份额达到创纪录的34.8%,而有线电视和广播电视分别占34.4%和21.6%。流媒体的使用量已经超过了以前的广播电视,但这是首次超过有线电视。
2024年7月,美国电视收视份额:流媒体41.4%,有线电视26.7%,广播电视20.3%。两年之内,流媒体增长了6.6%,有线电视下降了7.7%,广播电视下降了1.3%。YouTube占比10.4%,成为第一个电视占比超过 10% 的流媒体平台(得益于内容创作者生态繁荣),紧随其后的Netflix占比8.4%(得益于原创内容和运营效率),二者明显处于领先地位(远高于Prime Video 3.4%,Hulu 2.7%,Disney+ 2.1%, Tubi 2.1%),合计占美国流媒体电视观看时间的近一半。
美国电视收视份额(尼尔森 The Gauge,2024年7月):流媒体41.4%,有线电视26.7%,广播电视20.3%
 
Netflix参与度报告和流媒体经济学:
Netflix从2023年开始每年发布两次《我们观看了什么:Netflix参与度报告》(What We Watched: A Netflix Engagement Report),这是一份关于人们在六个月内在Netflix上所观看内容的综合报告。
观看时长或参与度是衡量会员幸福感的最佳指标。最新的参与度报告显示,2024年上半年,人们在Netflix上观看了超过940亿小时,其中电影占比27.4%,电视剧占比72.6%,自制和授权内容各占50%;一共有16161部作品,其中电影9360部(自制1695部),电视剧6801部(自制3374部);自制的原创作品329部(与2023年上半年大致相同),其中电影105部,电视剧224部。
按总观看时长衡量,2024 年上半年,最受欢迎的十大作品吸引了总观看时长的5%,排名前100的作品吸引了18%的观众,排名前1000的作品吸引了57%的观众。排名前27%的作品占据了89%的观看量,而排名后73%的作品仅占据了11%的观看量。
Netflix参与度报告:2024年上半年Netflix热门作品的观看量
用户规模之外(2.78 亿付费会员),Netflix最难复制的优势是首因效应(Primacy Effect):Netflix 是“我应该看什么?”的第一个答案。凭借其推荐算法、数据优势和不断更新的优质内容,Netflix 抓住了全球数亿观众的关键决策时刻。Netflix 不断扩大其产品范围——从授权内容到原创内容、多国语言(190多个国家/地区)、非剧本系列、游戏、直播(如体育赛事),并不断寻找新的盈利模式。
Netflix作为流媒体战争的获胜者,进入“增长由每单位内容和/或每个客户的货币化能力驱动”的平台竞争时代,其竞争优势体现在:流媒体经济学(Streamonomics)——付费和免费流媒体时代电视/电影创作、授权和营销的单位经济学,即每千观看小时收入和成本。Netflix 的参与度更高(2024 年上半年全球观看时长为 940 亿小时),因此每千观看小时成本 (CPMVH) 较低,而每千观看小时收入 (RPMVH) 则保持健康水平。
流媒体经济学(Streamonomics):Netflix的每千观看小时收入(RPMVH)和成本(CPMVH)
 
长视频VS短视频,大屏VS小屏:
流媒体视频(长视频为主)和社交视频(短视频为主),通常不被归为一类,但都在抢占人的有限注意力,参与取代电视的竞赛。数据不断显示,社交媒体平台(主要是 YouTube、TikTok和Instagram;国内抖音、快手和微信视频号)上的视频消费量正在强劲增长,用户每年在这些平台上花费的时间越来越多。虽然抖音/ TikTok及其同类短视频仍然以智能手机为主要观看平台,但也在向大屏延伸(TikTok和X/Twitter推出了电视版),而“长短通吃”的YouTube 大屏收视快速增长,在美国电视收视占比高于Netflix(10.4% vs 8.4%)。
YouTube主要是通过智能手机观看(63%),其次是PC(34%)和联网电视(27%);而Netflix主要是在联网电视上观看(58%),其次是智能手机(30%)和PC(21%);这里的联网电视(互联网电视),未包含通过运营商的机顶盒在大屏上观看的数据。
一项Netflix在多屏上注册和观看的统计数据验证了大小屏之间的互补关系:
在全球平均 100 个 Netflix 注册用户中,最大份额来自笔记本电脑/台式机/Mac设备,共计40个注册用户。第二大份额是移动设备(智能手机和平板电脑),共计35个。最小份额(25个)来自电视。这是有道理的,因为电视设备通常是最慢/最难注册的设备,并且按每日使用时间份额计算,总体使用率最低。
在使用这些订阅的第一个月,电视的份额从25%飙升至近50%,而移动设备的份额从35%缩减至25%,PC+Mac 的份额从40%缩减至28%。
到第六个月,电视占据70%的时间(注册份额为25%,观看份额1个月后为48%,6个月后70%),而移动设备则缩减到15%(注册份额为35%,观看份额1个月后为25%,6个月后为15%)。
客厅电视是观看长视频内容的最佳场所,而移动设备是关键的获客渠道(Acquisition Channel)和参与度助推器(Engagement Booster)。智能手机垄断生活的当下,手机成为我们器官的延伸,其在操控灵活性、语音输入、社交互动等方面具有明显优势,手机小屏和电视大屏形成优势互补,通过大屏获得优质播放体验,通过小屏进行灵活操控,大小屏统一智能运营和全渠道营销成为趋势。
 
大小屏统一智能运营
电视大屏的运营,已经进入大小屏统一智能运营的平台竞争时代,增长由每单位内容和每个客户的货币化能力驱动。
“双治理”和大小屏统一智能运营:
从2023年8月起,国家广电总局联合有关部门开展了治理电视“套娃”收费和操作复杂工作。目前治理工作已取得显著成效,实现了开机看直播、大幅压减收费包、取消有线电视和IPTV开机广告、优化电视回看等阶段性目标,有效解决了群众“看电视难、看电视烦”问题,群众满意度显著提升。
治理电视“套娃”收费和操作复杂,需要从融合大包和交互创新两个方面着手,实现大小屏统一智能运营:
1)融合大包:通过SDK聚合爱优腾芒内容做融合大包,实现直播、回看和点播的统一智能运营,包括智能EPG(直播点播化)和超级频道(点播直播化),可从根本上解决电视“套娃”收费问题;
2)交互创新:从红外遥控器,到语音遥控器,再到手机遥控器/大小屏互动,微信电视结合AI大模型(AI搜索和AI管家), 带来全新的自然语言交互(多轮对话,LUI和GUI的混合形式)和智能问答(变搜索为问答,RAG检索增强生成),可从根本上解决电视操作复杂问题。
电视“套娃”收费产生的根源,就是因为“爱优腾芒”计费点太多了,每家内容都是独立专区(独立APK),用户体验是割裂的。《治理电视“套娃”收费工作指南》要求:“对影视类 SDK 收费包进行合并,只保留1个影视类 SDK收费包”,为通过SDK聚合“爱优腾芒”内容做融合大包提供了政策支持。
通过SDK聚合“爱优腾芒”内容做融合大包,实现统一智能运营(统一媒资、统一搜索、统一推荐、统一订购、统一播放)和直播点播融合(智能EPG:直播点播化+超级频道:点播直播化),从“人找内容”到“内容找人”,为用户提供统一的内容发现、计费和观看体验。一方面解决电视大屏“收费包多、收费主体多、收费不透明”问题,另一方面通过融合大包做大付费点播收入蛋糕,让消费者、内容方和运营商都受益。
融合大包聚合了爱优腾芒等点播内容,需要通过“数据+算法”驱动的统一智能运营才能发挥超级聚合平台的价值,才能提升运营变现效率和挖掘片库价值。直播、回看和点播普遍作为相互割裂的独立入口,需要建立打通直播、回看和点播的统一媒资标签和统一智能运营体系,才能通过智能EPG(直播点播化)和超级频道(点播直播化)实现直播点播相互导流,以及直播点播融合的无缝观看体验。
电视操作复杂问题,很大程度上是由遥控器操作和电视交互困难造成的。《治理电视操作复杂实施指南》明确了三个阶段的工作目标:第一阶段:开机看直播;第二阶段:减少简化遥控器;第三阶段:机顶盒电视机一体化。其中,第二阶段减少简化遥控器,要求“完善语音搜索语料库”“研发具备手机遥控功能的App”“优化推广智能语音、手机等遥控方式”。
红外遥控器操作简单,有其存在的价值,但不便于文字输入,只能进行首字母搜索。语音遥控器克服了手动输入困难,可以进行语音搜索,但语义理解和问答能力有待提升。手机遥控器/微信小程序,除了实现红外遥控和语音遥控功能之外,还可以发现电视内容(一键投屏电视播放),进行社交分享(包括Watch Party),结合AI大模型实现自然语言交互和智能问答,利用手机摄像头和麦克风实现“手机+电视”5G应用,开展大小屏联动和全渠道营销活动。
微信电视作为大小屏互动和离屏触点营销工具,集内容发现、社交裂变、AI搜索/AI管家和5G应用于一体,让电视“更好看、更好玩、更好用”;通过增长黑客(拉新、促活、留存、变现、传播)和“四力”增长模型(组织力、商品力、运营力、产品力)运营方法论,有效提升大屏开机率、活跃度和付费转化率;通过“一个中心三个子系统”(新媒体为中心,运营商为子系统)实现跨运营商的互联互通和同步观影(Watch Party),促进新媒体和运营商多方共赢、协同创新。
开机看直播导致点播流量急剧下滑(下滑30%甚至更高),为电视大屏增值业务运营带来了新的挑战。解决之道有两个方向:
一是从大屏EPG出发,通过智能EPG(直播点播化)实现直播/回看导流点播,通过超级频道(点播直播化)实现点播/回看组成个性化频道,最终实现直播点播融合的无缝观看体验;
二是从遥控器出发,通过语音遥控器和手机遥控器/大小屏互动来突破大屏EPG限制,语音唤起大屏点播内容或手机发现内容、一键投屏电视观看,微信电视更可结合AI大模型实现自然语言交互和智能问答。
 
电视商业模式:
电视经济由两个来源推动:销售内容(即订阅会员),销售观看内容的观众(即广告电商)。
经济学家张五常在《经济解释》(五卷本)中提出协助收费的法门:隔离和捆绑,也是电视商业模式的法门:
1)隔离:不付费无法享用,如购买门票和会员;
2)捆绑:共用品捆绑私用品(价值高的捆绑价值低的),如融合大包和Prime会员。
”出售共用品的人的选择是某程度隔离收费,某程度放开让不付费的享用。均衡点是在边际上,“量”的选择是隔离的直接收入,减去不隔离的间接收入,与执行的费用相等。“—— 引自《经济解释》卷一:科学说需求(第239页)
隔离的直接收入即订阅会员收入(内容价值),而不隔离的间接收入即广告电商收入(流量价值),这里的均衡点是“量”的选择,即隔离门槛的设置,让多少人付费多少人免费,因为订阅和广告都有执行的费用,变现的效率也有差异。
根据需求定律(任何物品的价格下降,其需求量必定上升),只要设置了门槛即会员价格(包月/包季/包年),就隔离了愿意支付更少费用的潜在消费者,因此付费会员渗透率总有一定上限(如30%)。
Netflix的定价策略是推出带广告的低价版,并尽可能拉大价格范围(带广告的标准版6.99美元/月,标准版15.49美元/月,高级版22.99美元/月),至于最终有多少用户选择带广告的标准版,取决于与标准版的价格差(即隔离门槛,8.5美元)和广告加载量(用户所能忍受的广告时长),Netflix的目标是让带广告的标准版的ARPU值与标准版的ARPU值趋同。
FairPay(Fair Pay What You Want,随你付/看着给)消费者定价的策略,是一种以购买者定价权最大化为前提的顾客参与式定价策略,可以结合促销活动向不同消费者收取不同价格,常用的活动形式包括竞价活动(同一物品消费者出不同的价格)和盲盒活动(同一价格消费者获得不同的价值或权益)。
捆绑是隔离之外协助收费的另一法门,其背后的经济原理是让买卖双方受益,有利于增加社会福利、减少无谓损失,尤其适用于TMT领域边际成本为零的数字商品和数字经济。
上海视畅携手安徽电信开创的融合大包模式,就是捆绑销售和超级聚合的典型案例,也是治理电视”套娃“收费的最佳方案。相对于爱优腾芒作为独立专区(独立APK),通过SDK聚合爱优腾芒做融合大包,并实现“统一智能运营”(统一媒资、统一搜索、统一推荐、统一订购、统一播放),为消费者带来统一的用户体验和极致的性价比,也为运营商和内容方带来大幅度提升的增值业务收入。融合大包之所以能够创造全局增量价值,一方面是因为扩大了受众,做大了蛋糕,除了让死忠粉(Super Fans)成为付费用户之外,还让路人粉(Casual Fans)也成为付费用户;另一方面捆绑服务往往带来效率、协同和规模经济,因此产生增值即集成价值(Integration Value),也就是平台的智能化和货币化运营能力的体现。
生活方式捆绑(Lifestyle Bundling),是一种被证明有效且得到广泛应用的捆绑策略,典型案例:国外的如亚马逊的Prime会员,Verizon的 ”+play”捆绑;国内的如淘宝的“88VIP”会员,招商银行的“掌上生活”。
运营商有机会成为生活方式品牌,已经建立的计费系统和“面向客户”的组织系统,可成为连接供给和消费的基础设施(即商业操作系统),“内容权益”叠加“生活权益”,打造连接、聚集和服务家庭用户的新入口、新平台、新生态。
 
上海视畅提供大小屏统一智能运营平台:
1)统一引擎平台:实现“统一智能运营”(统一媒资、统一搜索、统一推荐、统一订购、统一播放),直播点播融合和相互导流(直播点播化+点播直播化,超级频道/刷刷看);
2)微信电视平台:实现大小屏互动和离屏触点营销,集内容发现、社交裂变、AI搜索和AI管家、“手机+电视”5G应用于一体,开展大小屏联动和全渠道营销,整合15分钟生活圈资源。
大小屏融合统一智能运营,形成内外循环两个交易闭环:
1)内循环:大屏视频消费(内容价值,垂直整合),视频消费属于数字商品,边际成本为零,交易闭环最短;
2)外循环:小屏生活消费(入口价值,连接生态),打造跨屏生态和15分钟消费圈,为电商和本地生活导流。
 
AI的进展和演进:
OpenAI 提出了通向通用人工智能(AGI,Artificial General Intelligence)的五级标准:
L1:聊天机器人(Chatbots)
具有自然语言对话能力。以ChatGPT为代表的大语言模型(LLM,Large Language Model)已经能够做到;
L2:推理者(Reasoners)
具有人类水平的推理和问题解决能力。OpenAI的o1推理模型接近这一水平,可以解决数学、编程和科学探究中的复杂问题;
L3:智能体(Agents)
能够代表用户采取行动,完成任务。AI不仅能理解和推理,还能实际执行具体操作,从数字世界走向物理世界;
L4:创新者(Innovators)
能够协助发明和发现。AI不仅能完成既定任务,还能创造新的知识,帮助人类开拓技术创新和科学发现;
L5:组织者(Organizations)
能够运行整个组织。达到AGI的阶段,每个人都可以拥有自己的人工智能团队,由不同领域的虚拟专家组成,协同创造几乎任何我们能想象到的东西。
目前,OpenAI的ChatGPT已达到第1级,o1推理模型接近第2级,具有博士级的推理和问题解决能力。第2级将成为快速实现第3级的跳板:能够自主决策和执行复杂任务的智能体。
从聊天机器人到推理系统的快速发展,以及预期的智能体的飞跃,预示着未来人工智能不仅可以重塑企业的运营方式,还可以重塑我们应对医疗保健、教育和科学发现方面的全球挑战的方式。
 
5月14日,OpenAI发布了多模态模型GPT-4o,“o”代表“omni(全知)”,是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。对于语音交互,不再需要“语音转文本-问答-文本转语音”(平均延迟3-5秒)拼凑多个模型,可以直接做到“语音-问答-语音”语音转语音实时对话(延迟短至232毫秒,平均320毫秒),与人类的响应时间相似。GPT-4o是在文本、视觉和音频上端到端训练的新模型,这意味着所有的输入和输出都由同一个神经网络处理。GPT-4o发布时仅向公众开放了文本和图像输入,以及文本输出。
10月1日,OpenAI在DevDay上推出了一系列新工具,包括实时API(Realtime API)、视觉微调(Vision Fine-Tuning)、提示缓存(Prompt Caching)和模型蒸馏(Model Distillation),旨在增强语音交互、提高视觉理解、降低成本和提升小模型性能。通过实时API,开发者只需调用一个GPT-4o API即可在其应用中构建自然的语音转语音对话体验,实现低延迟的语音交互,执行如下订单或提供个性化服务等操作。通过视觉微调,开发者除文本外,还可以使用图像对GPT-4o进行微调,用少至100张图像就能提高GPT-4o在视觉任务上的性能,从而更好支持视觉搜索、物体检测、医学图像分析等应用。
9月20日,OpenAI发布了OpenAI o1(预览版),这是一系列新的人工智能模型,经过强化学习(RL,Reinforcement Learning)训练,可以执行复杂的推理,擅长解决科学、编程和数学等理工科问题。o1 在回答之前会思考——它可以在回复用户之前产生一个很长的内部思维链(CoT,Chain of Thought)。通过强化学习,o1 学会磨炼其思维链并改进所用的策略,显著提高了模型的推理能力,实现了从“对话”到“思考”的跃迁。OpenAI o1带来了从预训练Scaling转向推理Scaling的范式转变:以往的LLM大语言模型,算力更多用在 “压缩知识”的预训练,成为“检索器”,能够在一系列系统1(直觉、快思考)任务中有优异的表现,而o1模型则分配了更多算力在 “思考答案”的推理过程,成为“推理器”,为底层LLM增添类似系统2(分析、慢思考)的推理能力。
10月8日,瑞典皇家科学院将2024年诺贝尔物理学奖授予91岁的约翰·霍普菲尔德(John Hopfield)和76岁的杰弗里·辛顿(Geoffrey Hinton),以表彰他们“通过人工神经网络实现机器学习的基础发现和发明”("for foundational discoveries and inventions that enable machine learning with artificial neural networks"),可谓正当其时。凭借自20世纪80年代以来的工作,两位科学家为机器学习和AI革命奠定了重要基础。人工智能使用物理学训练人工神经网络,是从物理学发展而来的。任何机器学习协议、引擎和核心都是基于方程式和概念,这些都纯粹是物理学的范畴。人工智能即基于人工神经网络的机器学习,目前正在彻底改变科学、工程和日常生活。
 
三位一体结构演化模式:信息(感知)-模型(思考)-行动(实现)
 
根据陆奇的大模型世界观,“三位一体结构演化模式”适用于任何复杂的适应系统:
1)感知:“信息”系统(subsystem of information),以数据为信息媒介,通过观察与整个人类环境交互捕获环境的信息;
2)思考:“模型”系统(subsystem of model),将数据转化为知识表达,通过推理和规划来实现预期目标的记忆和泛化;
3)实现:“行动”系统(subsystem of action),与环境互动,控制能量转换,实现对物理、生物世界和人类社会的控制,达成预期目标。
第一个范式是互联网范式(始于1995-96年):信息无处不在。今天大部分数字化产品和公司,包括Google、微软、阿里、字节,本质是信息搬运公司,获取信息的边际成本变成固定成本,解决的是连接和供需匹配的问题。
第二个范式是大模型范式(始于2022-23年):模型(知识)无处不在。以OpenAI的ChatGPT为标志,LLM大语言模型的本质是压缩人类知识,“预测下一个单词”的统计模型,并扩展到多模态,生成知识的边际成本变成固定成本,解决的是生成和供应不足的问题。
下一个范式是AI Agent范式:行动无处不在。信息-模型-行动三位一体,Agent能够与环境互动,自主决策和执行人类任务(如AI助手/AI管家、自动驾驶、机器人、空间智能),解决的是行动和人机协同的问题。AI演进方向:从AI Copilot(助理/副驾驶)到AI Agent(代理/智能体/行动体)再到AI Autopilot(自主/自动驾驶),今天是“Human + AI Copilot”时代,开始进入“AI Agent +Human Copilot”时代,未来是“AI Autopilot”时代。
 
AI赋能大小屏统一智能运营
生成式AI赋能大小屏统一智能运营,主要是体现在两个方面:一是赋能搜索引擎和推荐引擎,包括搜索生成、推荐生成以及AI增强元数据;二是赋能电视交互创新,包括AI搜索和AI管家(AI Voice Agent)。
内容创作的演变趋势:从PGC(Professional Generated Content专业生成内容)到UGC(User Generated Content用户生成内容),再到AIGC(Artificial Intelligence Generated Content人工智能生成内容)。目前电视大屏的内容,以PGC专业制作的影视等长视频内容为主,兼顾UGC短视频内容,已经开始拥抱AIGC,如AI生成的海报(剧照)、看点(摘要、评论)和短视频(剪辑、精彩片段),以及AI翻译、字幕和配音等等。
上海视畅的搜索和推荐引擎,一方面对标YouTube和Netflix的最佳实践,另一方面积极拥抱生成式AI赋能,实现搜索生成(RAG检索增强生成)、推荐生成(PGC&UGC推荐+AIGC)以及元数据增强(内容场景识别)。
从搜索,到推荐,再到生成,内容发现主要依赖于三种类型的引擎:搜索引擎、推荐引擎和生成引擎。搜索引擎是用户主动获取信息,用户明确知道自己要找什么,通过输入关键词进行搜索。推荐引擎则是根据用户的历史行为和偏好,主动推送相关内容,包括基于内容的推荐、协同过滤以及混合推荐策略等。生成引擎如大语言模型,通过预训练压缩了人类知识,根据输入的提示词直接生成答案。这三种引擎各有特点,搜索引擎侧重于信息检索,推荐引擎侧重于个性化内容推送,而生成引擎则侧重于创造性内容的生产。
搜索引擎的进化方向是:搜索生成(RAG检索增强生成)。RAG(Retrieval-Augmented Generation)——基于检索增强的内容生成,把领域知识检索(基于结构化元数据的关键词搜索和基于非结构化数据的向量搜索)和通用大模型的理解和生成能力有机结合起来,变搜索为智能问答和搜索生成体验。
下一代推荐引擎将朝着“推荐生成”范式迈进,在人类生成内容(PGC+UGC)不能满足用户需求的情况下,通过人工智能即时生成个性化内容(AIGC)。视畅已经走在探索推荐生成引擎的路上,如生成抖音化的超级导视(以短带长,可从短视频一键切换到长视频),如生成自动播放的超级频道(由点播/回看组成的个性化频道)。AIGC时代,将会催生新一代短视频平台和影视内容制作的繁荣,为用户带来个性化内容推荐(PGC+UGC)和个性化内容生成(AIGC)的新体验。
统一媒资元数据(Metadata)是统一搜索引擎、智能推荐引擎和AI大模型应用的基础。视畅积十年之功建立了全网影视媒资大数据平台,媒资来源包括爱优腾芒等视频网站、豆瓣时光网等影评网站、猫眼淘票票等票房数据、央视卫视地方台数千个直播频道、数十家合作方CP/SP内容。基于“众包”(Crowdsourcing)思想(聚合利用各个来源的元数据标签,人工所打标签缺失则由人工智能提取),建立了打通直播、回看和点播的统一媒资标签体系,一方面兼容国家行业标准GY/T 360-2022 《广播电视和网络视听节目内容标识标签规范》,另一方面从标签层级和数量上来说更丰富,也更准确(有可信度加权,权值也参与智能推荐计算)。
在此基础之上,视畅进一步应用AI增强元数据和识别内容场景,如自动提取标签,识别片头片尾和人像/图像等。针对标签缺失的影视类和非影视类内容以及短视频,则从标题、描述、字幕等文字信息自动提取标签,已实际应用于智能标签补全、搜索和推荐引擎。针对电视剧等剧集缺少统一的片头片尾时间戳数据(用户追剧不能自动跳过片头片尾),视畅开发的片头片尾智能识别方案,通过抽帧和画面识别已能自动完成片头片尾时间戳打点。基于多模态大模型的图像识别能力,可自动识别明星人物和广告商品,实现场景级别的AI搜索和Shoppable TV(手机购买电视广告商品)。
 
AI交互入口(Intent-based LUI+GUI):
语音是一种高效的输入方式,而屏幕是一种高效的输出方式。未来的AI交互应该是语音输入和屏幕输出的融合,形成LUI(Language User Interface)+GUI(Graphical User Interface)的混合形态。过去以供给侧应用商店为中心的旧范式,将让位于以需求侧用户意图为中心的新范式,用户不用打开App,只需一句话说明需求,系统会识别用户意图、调用App完成各种服务,交互即交付。AI交互(Intent-based LUI+ GUI),基于意图识别的语音输入和屏幕输出的融合,有机会成为需求聚合和应用分发的统一AI交互入口。
视畅的AI搜索和AI管家,作为新的AI交互入口(AI Voice Agent),有三个核心功能模块:
1)RAG检索增强生成,把通用大模型和领域搜索推荐引擎结合起来;
2)AI Agent代理/智能体/行动体,负责与物理环境互动和执行任务;
3)意图识别专属模型,预定义应用场景和人工标注数据,微调预训练的轻量级模型。
通用大模型压缩了人类知识,无所不知、无所不答,可通过提示词工程(Prompt Engineering)生成所希望得到的答案。但通用大模型缺少专业知识和数据(如不知道片库有哪些内容),因此需要RAG检索增强生成,通过大模型外挂知识库,更准确检索并生成知识库范围内的内容。实际发现,因为有了较为完整的结构化元数据标签体系,对于简单的搜索查询(如片名、类型、演员、地区等组合),搜索引擎往往能够给出更好的答案;对于用户不知道搜索什么的情况(如我该看啥,热播榜单),推荐引擎往往能够给出更好的答案;只有对于需要语义理解的复杂提问(如狗和人类友谊的电影,有“生活像一盒巧克力”台词的电影),才需要给到大模型。这意味着需要意图识别来分发不同的提问,何时该调用搜索、推荐和大模型,RAG在非结构化数据的向量检索时更有用武之地(如客服问答对或文档检索)。
AI Agent是大模型落地业务场景的主流形式,它可以根据环境和任务的要求,自主地进行决策和行动。针对LLM大模型驱动的Agent,作为大脑的LLM因为规模太大而难以进行微调,而小模型就像小脑,专门用于理解和适配环境,是可以适应环境变化、多次训练的,因此大小模型结合是一种高效、实用的Agent实现方案。未来的Agent生态将由大模型与小模型以及多Agent组成,大模型强大但价格昂贵,小模型便宜且推理迅速,多Agent相互协同完成更复杂的任务。
意图识别专属模型,就是针对特定任务和人工标注数据而训练的轻量级小模型,用于识别用户意图、调用相应的API执行任务(类似于苹果Siri采用的App Intents框架)。意图识别是将用户的指令(非结构化的自然语言)转化为结构化的、机器可执行的语言,即Domain(领域)-Intent(意图)-Slot(词槽)。意图识别专属模型,侧重于语义理解和意图分类,只需要小样本的标注数据就可以取得准确的意图识别效果;再结合基于规则(结构化元数据)的实体识别来完成词槽填充,就能够自动完成各种任务。举例说明:“快进10分钟”,意图识别为电视控制API,词槽识别为“快进”“10分钟”;“我想看吴京的动作电影”,意图识别为视频搜索API,词槽识别为演员“吴京”、类型“动作”、分类“电影”;“帮我点一杯瑞幸的大杯冰拿铁”,意图识别为瑞幸点单API,词槽识别为“大杯”“冰”“拿铁”。Agent具备多轮对话和场景感知能力,能主动追问让用户补全信息或者确认订单,能根据用户的生活习惯和使用场景,智能推荐专属的服务。
 
上海视畅提供生成式AI赋能的AI搜索,包括红外遥控器、语音遥控器和手机遥控器的升级融合方案:
1)提供内容聚合(通过SDK聚合爱优腾芒内容做融合大包)和统一媒资元数据标签补全,实现直播、回看和点播的统一搜索;
2)搜索和推荐相结合,根据用户搜索和观看行为,主动推荐热播、相关和个性化内容;
3)AI大模型压缩了人类知识,利用RAG检索增强生成,变搜索为智能问答和搜索生成体验;
4)AI交互(Intent-based LUI+GUI),用户通过语音(或文本)表达意图,系统识别用户意图、调用API执行任务,在图形界面上呈现结果;
5)手机遥控支持两种模式:
一是AI搜索模式:手机语音输入,电视展示和响应,兼容蓝牙语言遥控器,大屏上不展示大模型对话内容,只展示匹配的影片;
二是AI管家模式:手机语音输入,手机展示大模型对话内容、电视响应,匹配的影片一键投屏电视观看。
视畅AI搜索能力支持情况
据统计,现在全国IPTV遥控器支持蓝牙占36.8%,不支持蓝牙只是红外占到63.2%。目前电视大屏的搜索功能,红外首字母搜索占比68%,语音搜索占比32%,搜索订单贡献占比约为10%,有了AI搜索和AI管家的加持,搜索贡献有望提升到20%甚至更高。
视畅的AI Agent/AI电视助手系统由以下部分组成:
1)人机交互设备(Human–Computer Interaction):语音遥控器(需要在电视上展示问答结果),微信电视小程序(在手机上展示问答结果,影视内容一键投屏,或者电视直接响应控制指令);
2)LLM Orchestration(路由和调度):负责协调生成式 AI 大模型(LLM)、领域搜索/推荐引擎以及行动引擎,包括数据预处理(内容场景识别),用户输入处理(用户意图识别),提示构造/检索和提示执行/推理(RAG检索增强生成),特定行动 AI Agent/AI搜索/AI管家(生成执行/控制指令);
3)推理引擎(Reasoning Engine):即生成式 AI 大模型(LLM),通过 API 调用大模型如文心一言、通义千问等,通过提示词工程生成所希望得到的答案;
4)领域知识(Domain Knowledge):特定领域的知识库和工具(API),如 IPTV/有线电视平台的搜索引擎和推荐引擎,再如智能家居(Smart Home);
5)行动引擎(Action Engine):负责与家庭环境的互动和任务执行(相当于AI 大模型的手和脚),如控制智能电视/机顶盒、智能家居,以及成为生活助手。
视畅AI Agent/AI管家系统架构
全渠道营销
全渠道营销(Omnichannel Marketing)强调无缝整合各营销渠道,提供一致性体验,并通过数据驱动的决策来优化营销效果。它不仅仅局限于线上或线下单一渠道,而是将线上电商、移动终端、社交媒体与线下实体店等多种渠道有机结合,以满足消费者的综合需求。
随着消费者在手机和短视频上花费越来越多的时间,电视大屏的开机率、活跃度和付费渗透率近年呈现下降趋势。大小屏统一智能运营结合全渠道营销,微信电视小程序与公众号、视频号、企业微信等形成营销闭环,通过大小屏联动和全渠道营销,开展拉新、促活、留存、传播、变现等营销活动,能够有效提升大屏开机率、活跃度和付费转化率,打造全省统一的AI交互入口和生活方式捆绑服务。
增长本质上就两点——拉新、促活,电视大屏的增长无非两条路径——存量激活、增量拓新。但这两点都没办法在自身平台内通过运营完成:拉新很显然是要去公域触达未曾触达过的人群,而需要促活的人群说明已经在大屏上不再活跃,必须通过一个更高频的外部平台去重新唤醒。微信电视和微信矩阵营销,就是拉新和促活的营销主阵地,背后有强大的微信生态来做支撑,具备覆盖的广度(海量覆盖保证新用户)、触达的深度(强势内容保证高唤醒)和转化的强度(通畅链路保证强转化)。
微信电视作为大小屏互动和营销工具,从拉新、促活、留存、传播到变现,每一个环节都有其价值,如离屏触点营销激活大屏沉默用户,使用产品功能提升大屏用户活跃,用户留存减少会员流失率和宽带离网率,基于会员体验券的裂变营销是高效的获客和会员转化方式(订购转化率达5%),形成付费转化和增量订购只是最后环节(已是会员的用户使用产品不会形成增量订购)。
微信电视的用户增长(活跃=新增-流失),有两条路径:
一是提升拉新,增加推广渠道,开展大小屏联动(沉淀大屏流量)和全渠道营销(沉淀小屏流量)等;
二是提升留存(减少流失),增加产品价值,如增加AI搜索/AI管家、体验券/优惠券、生活方式捆绑(“内容权益”叠加“生活权益”)等。
微信电视的营销理论,还是要回归4P营销组合,即产品(Product)、价格(Price)、渠道(Place)、促销(Promotion)。一次成功和完整的市场营销活动,是以适当的产品、适当的价格、适当的渠道和适当的传播促销推广手段,将适当的产品和服务投放到特定市场的行为。
渠道的本质就是规模化触达消费者,微信电视融入全渠道营销,就是要玩转4P营销组合,做好微信矩阵运营的人、货、场和内容、社交、商业化,以更低的成本来规模化触达用户。
微信电视4P营销组合策略:丰富的大小屏联动促销方案+多样化的会员产品形态+更诱人的价格包装+更完善的渠道能力,尽可能撬动四个策略因素中的多重变量,达成更好的营销成果。
目前运营商的全渠道包括移动App、微信公众号/小程序/企业微信、短信、电商平台、营业厅、客服、装维人员等,但线上线下双渠道还未打通和无缝衔接;而微信电视作为手机连接电视、固移融合和私域运营的抓手,仍待与全渠道进一步打通和整合。生成式AI赋能的AI搜索和AI管家,可集成到微信电视和微信矩阵,结合AI客服和全渠道营销,打造全省统一的AI交互入口和生活方式捆绑服务。
微信矩阵运营:以小程序为主要载体,依存微信生态做增长,打微信矩阵运营组合拳(含小程序、公众号、企业微信、视频号、朋友圈、微信支付、微信群等)。
微信矩阵运营之“人·货·场”:
人货场之人:根据用户来源、活跃度、用户画像、订购习惯做用户分层;
人货场之场:以小程序为主,向以视频号/公众号为主的公域、以企业微信为主的私域拓展,打通矩微信阵;
人货场之货:微信电视小程序是内容载体,也是用户沉淀的载体,还是商业化的主要渠道,视频消费叠加生活消费,需通过微信矩阵的各渠道,让用户活跃在小程序,并向其他载体拓展。
微信矩阵运营之商业三要素:
三要素之“内容”:业务以视频内容为核心,天然拥有优质内容——头部节目、热点节目、运营商策划、视畅策划等;
三要素之“社交”:通过内容分享、活动分享、AI管家问答分享、公众号推文分享、虚拟影院分享等实现;
三要素之“商业化”:变现价值直接体现在会员订购和生活方式捆绑服务,打通小程序订购,实现小程序渠道购买的服务便捷性、价格优惠性,符合小程序在微信矩阵中“会员制服务”的载体定位。
微信矩阵运营组合方式:
1)公众号+小程序:用户可通过公众号的菜单栏、推文链接、对话消息添加小程序;
2)视频号+小程序:用户可在视频号短视频的置顶评论里点击链接跳转小程序;
3)企业微信+小程序:用户可通过企业微信1V1聊天框、社群、应用栏添加小程序;
4)公众号+企业微信+小程序:用户可通过公众号的菜单栏、推文、消息添加企业微信,后续企业微信可向用户发送带小程序链接的活动信息、福利体验、入群消息、节目推荐、AI管家问答等。
 
作为视频智能运营专家、融合大包和微信电视的开创者和领导者,上海视畅已为30多家省级运营商和广电新媒体提供视频智能运营(统一媒资标签体系+全场景“7维”智能推荐+分析洞察平台和精准营销工具)、融合大包(统一媒资、统一搜索、统一推荐、统一订购、统一播放)、微信电视(内容发现+社交裂变+AI搜索/AI管家+5G应用)产品服务,近年助力合作伙伴获得10多项国家或省级创新奖项,期待AI赋能大小屏统一智能运营和全渠道营销的时代,携手更多合作伙伴,“创造电视新价值、赋能生活新生态”!


上海视畅信息科技有限公司
上海市浦东新区张江集电港龙东大道3000号1号楼A幢12楼A区
联系电话:
021-61001763
合作咨询:
business@vstartek.com
Copyright@2018 上海视畅信息科技有限公司 沪ICP备10026472号 营业执照