国联证券:电力设备与新能源行业深度研究:风电深度系列-一-:向海而兴,乘风破浪-230203

时间:2023年02月03日 作者:
  • 格式:pdf
  • 大小:1.7M
  • 页数:共46页
  • 来源:国联证券
  • 类型:行业分析
  • 评级:增持
宽宽的未来(2023-03-31 00:50:06)

$凯莱英(SZ002821)$ 年报中看到的几个亮点:

1、公司在手订单总额 11.50 亿美元(含2023年已执行的订单)

2、截至本报告披露日,公司新增大型跨国公司 API 验证项目 2 个。

3、公司服务的临床三期项目涉及诸多热门靶点或大药靶点,项目占比超过 60%,例如 KRAS、 JAK、TYK2 等,为持续获取重磅药商业化订单提供项目储备。

4、经过多年的耕耘,日本市场进入收获期,现有客户合作深度持续提升,新客户有序开拓,随着服务项目陆续进入后 期和商业化阶段,收入快速增长,2022 年来自该地区收入同比增长 202.06%。

5、截至本报告披露日,国内 NDA 阶段在手订单 40 个。公司具有多项高效完成 动态核查的项目经验,随着更多项目逐渐实现国内甚至海外商业化,将快速推动公司来自国内客户的收入快速增长。

6、2022 年公司签订多个连续性反应工艺开发 及技术输出订单,服务领域也从制药领域逐步延伸至化工行业。

7、报告期内,寡核苷酸业务收入同比增长超过 464%,承接新项目超 25 个,包括 Phase II 之后项目 5 个。寡核苷酸团队在新技术开发方面取得重大进展,为解决寡核苷酸药物生产面临的技术 手段单一、效率不高、产能不足、三废量偏大、生产成本偏高等诸多挑战提出了解决方案,为今后项目拓展奠定了坚实 的基础。

最后还有一个行业预测:Frost&Sullivan 报告预测,由中国医药研发服务公司提供的全球外包服务的市场(不包括大分子 CDMO)规模将由 2022 年的 1,312 亿元增长到 2026 年的 3,368 亿元,复合年增长率约 26.6%。

至于分红,相较于21年的每10股8元,在21年10送4的基础上每10股18元,分红比例相差不大。

遗憾的是,凯莱英并没有像药明一样给出23年的业绩指引,这无疑增加了投资小凯的不确定性。从另一角度看,新冠大单收入对小凯的影响远远大于药明,这也增加了管理层对业绩预测的难度。而且,从以上亮点可以推测,小凯今年的业绩弹性也较大,这可能也是没有给出业绩指引的原因吧!

从小凯上市时18亿的营收到22年的102亿,管理层无疑的优秀的,没有迹象表明这种信赖不值得继续下去。

投资需要分析,也需要一点运气。


白紫微(2023-03-31 00:49:24)Q:国内的厂商,寒武纪、景嘉微、海光和昇腾,性能达到了海外什么层级的水平?
A:第一,景嘉微。我们认为景嘉微不是做AI芯片的厂商,景嘉微的产品目前只能用于图形处理、图像渲染,未来可能能实现光线追踪。目前景嘉微最好的JM9系列产品,大概达到英伟达GTX 1050的水平,只能算入门级GPU。第二,寒武纪。寒武纪最好的产品是思元590,这款产品在文心一言中有小规模的部署,大概几百件,并且也只是文心一言中众多业务场景的一小部分,没有实现大规模部署。我们认为寒武纪的产品只能用于大规模推理中的一小部分场景,还不能做大模型训练,还有许多需要弥补的地方。第三,华为昇腾。华为昇腾只能用于华为自身生态中的大模型业务,通用性差。比如昇腾不能做GPT-3,因为昇腾910不支持32位浮点,而目前大模型训练几乎都要使用32位的浮点,所以华为昇腾芯片只能利用华为开发的框架(如MindSpore),在加上优化好的大模型,比如盘古CV。任何公开模型都必须经过华为的深度优化才能在华为的平台上运行,而这部分优化工作华为还没有开始,所以我们现在认为华为只能运行自己闭环的大模型产品。第四,海光信息。海光的深算1号可以运行大模型,目前正在开发深算2号。深算1号相当于英伟达的P100的水平,但是性价比低,即便在openai最早训练GPT-3的时候,也采用了V100芯片。此外,海光还存在迭代问题,因为海光只拿到了AMD第一代GPGPU的授权。
常羊平头哥(2023-03-31 00:48:14):$赛力斯(SH601127)$ 赛力斯战略方向绝对没有问题,甚至可以说是很高明,人家真金白银投入100多亿跟华为深度合作,没有点自己的核心技术跟对未来新能源车发展走势的预判,敢投资这么多?赛力斯重庆第三工厂随便拉一个工地员工,人家直接告诉你这是华为赛力斯造车基地,第三工厂预计23年7月底完工,从现在现场传来的资料,大部分大楼都已经完成封顶,去年国庆节开工,仅半年就实现主体结构封顶,这效率还不够快吗?喷子们稍微对比一下拉胯的房地产开发商的建房速度就知道熟快熟慢了,新工厂在智能化方面和最强的华为结合打造问界品牌,老工厂肯定是用于生产低端走量产品,主打外贸出口一带一路,7座混动suv硬件方面又是采购比亚迪最强DMI混动系统,价位又这么亲民性价比直接拉满,真不知道网上为什么这么多人喷,你至少先了解人家的市场定位再喷吧?你不买就代表别人不买了吗?我觉得赛力斯领导人,战略方向很清晰。两个最强将助力赛力斯迅速崛起!

股期情绪2022(2023-03-31 00:46:22)

龙头战法二十年

光阴似箭,转眼间距离第一次开户已满二十载,开个贴子以纪念那份平凡岁月中的初心坚守。交易者注定是孤独的修行,人生又何尝不是,珍惜每一天,希望每一步都留下单纯、从容的脚印。切记:地低成海,人低成王。圣者无名,大者无形。鹰立如睡,虎行似病。贵而不显,华而不炫。韬光养晦,深藏不露。才高而不自诩,位高而不自傲。路径窄处,留一步与人行;滋味浓的,减三分让人尝。
开户二十载留念

打板的最高境界: 就是一种简单的动作(一种单纯专注的生活),虽然打板可以有很多知识学问,但在打的动作上,他却还原到非常单纯有力的风格,超越了知识学问。也就是说,做涨停的艺术不是一成不变的,随着每人的个性喜好,用自己适当的方式,才是做涨停的本质。如果涨停是一成不变的,也就没有道可言了 龙头战法心得体会: 乘势待时,耐心自律。法无定法,随市而动。 什么是趋势?如何理解趋势的? 1.趋势就是随机走势中相对不随机的部分;2.离开周期谈趋势就是耍流氓。 关于市场行为模式的问题: 建立模式先要认识市场行为逻辑,否则知其然不知其所以然。其实这个过程就像钻牛角尖,不断压榨自己的生存空间(专注于特定的市场行为)。别学猴子掰棒子,这山看着那山高。时刻站在大概率一方,简单的模式反复做(执行),时间会给你钱。专注会让你成为这一模式的高手。直到执行成为你的第二天性,这一模式的完美化身。只有这样才能在市场找到自己的容身之所 关于观点与市场行为: 任何人都可以持有任何观点,为了表达自己对未来的观点而采取行动,行动的总和导致了市场行为。反过来,你的观点又和市场行为没有任何关系,和任意模式是否有用也没有任何关系。认识到你就知道别人怎么样不重要,自然知道该做什么。做好自己,最简单的,依据啥进,依据啥出。用钱证明自己的观点即可,我的理解 关于周期: 首先要搞清楚什么是周期,数几个板谈周期其出发点就是错误的。周期是特定时间内的时效规律,所以是帮助我们观察市场的工具。再者不要把周期神化了,工具天生有好坏之分吗?没有,合适的就是好的。关键是怎么用?结构,级别,周期。才是高层次 股票到底是个什么,打板的核心是什么? 1.有个市场叫做股市,这个市场里的商品就是股票;2.既是商品就有价格,有人买卖。打板是你以当天最高价买入商品的行为。打板的核心彻底点说是持续稳定赚钱。注意,我说的是持续稳定的赚钱,而不是赚钱。阿猫阿狗运气好都能赚到钱,但是下次很可能就还回去了。我发现这里很多人打板不是为了赚钱,而是为了爽。真的,人其实都是有自我毁灭倾向的。 关于真理: 真理,往往在大多数人关注不到的地方。换句话说:众人经常是错误的。所以说,一个人要想成功,必然是:把功夫用在被大多数人忽视的地方,深度挖掘、独辟蹊径,走出与众不同的路子来。具体到交易上来说,投机祖师爷livermore说“不要接下跌的刀子、顶和底是最贵的、等火车停下来并向目的地开的时候再上车、看对的人很多但坐得住的少等等(原话忘了,大概是这么个意思)”,价值投资者巴菲特的信条“众人贪婪我恐惧,众人恐惧我贪婪”,趋势交易者的交易策略、盈利模式等,都让他们的思维模式、行为模式异与众人,并可以助其成功。你,要考虑一点:是什么让你和愚蠢的众人区别开来?如果你没有,你就是众人中的一员。 稳定的概念是什么,怎么买才算的上是稳定? 大机会来时不会错过,平时没机会时死不了。 关于道和术: 道、术,两者不矛盾:理论是对现实的一种简化假设,有一定的适用范围。术属于实践的总结部分,还是实践。实践是检验理论的唯一标准,那么只要效果好,学不学理论、悟不悟道都无所谓。当然,不学更大可能是低水平重复建设(犯错),效果难好到哪去。虽说每个人都是独一无二的,但面对的问题99%是前人面对过的。一般人从自己的经历中吸取教训,个人的时间和经历都毕竟是有限的,聪明人从别人的经历中吸取教训,毕竟站的高尿的远。非要享受前人掉进坑里的感觉,请系好安全带。日子是你自己过,开心就好。 关于止损: 止损放在证明你错了的地方。但具体什么叫错了,需要你自己定义。如果你定义“封不住”证明你错了的话,也是可以的。但这个到底是否好用,需要你通过历史数据进行统计。 关于龙头和概率的问题: 世上哪有绝对的事,包括这一句。如果我说龙头战法有用,你能找出一万个没用的时候。关键是怎么用!从概率学上来说,就是只做大概率的事,只操作胜率大于50%的机会,久战必胜。如果你追求100%胜率,龙头战法确定也没用,但如此,世上又有什么可用吗?包括做跟风。说到底,首板也罢,接力也罢,都是做概率,路不同而已,看你适合哪个。我的理解:做龙头更确定,更简捷。大部分人都把龙头战法神话了,所以不会用了。 牛市的操作方法: 对大部分人而言,在牛市中买入不动才是最好的策略。牛市不要炒,要拿!当然,为了防止点子背,选的股很烂,多买几只,乱枪打鸟,也可以有不错的收益吧。 短线的技术里面 K线技术的占比有多少? 不是占比多少的问题,要理解技术分析的作用。技术分析可以出信号。就如同红绿灯:红灯亮,不能过;绿灯亮,可以过;黄灯亮,要注意。但我们过马路时除了看灯,还是要看下路吧。红灯亮的时候你过了没出事不代表正确;绿灯亮过的时候不看两边有没有车,结果被醉驾的撞了,怪谁。 任何分析都有不确定性,亏钱的概率都是有的,只是大小的问题。 关于分仓和满仓: 我的观点对大多数人是毁三观的,先假设你的系统是以下两种情况: 1.系统99%的时候都是对的。对应的就是重仓出击。 2.系统99%的时候都是错的。对应的应该是每次出错时只损失极小的资金,而当碰到那正确的1%的时候,就大赚特赚。 当然,我这说的有些极端,极端放大后来分析,结论显而易见:如果你的操作很少,关键时候,就来那么一下。追求的是高胜算,那就要重仓出击,集中优势兵力打歼灭战,就是要不胜不战,一战而定。反之,如果你的系统中有较多“试错——加码”的交易,那就需要仓位控制了。 就我自己而言更倾向于前者,成长中的很大利润都来自重仓一只。对于小资金(三千万以内)我的建议也是最好不超过两只。 如何做龙头: 做龙头如经验丰富的老茶农制茶,择时而采,赶时而制,讲究时机。采茶消青揉捻烘焙等工序一个不能省,要有耐心。乘势待时,耐心自律。要注意天气是动态变化的,要根据天气做出应对。法无定法,随市而动。 关于短线交易: 我们做市场的,不掺杂其它,顺应市场就可以了。没有契机不做,即使有机会,也不见得非把握住不可。没兴致、状态不好就不参与嘛。 最重要的,短线前期投入大,因为热爱,才无需坚持。游资级别,炒手说当游戏了,就是基本手筋,其实没那么苦逼。 关于中线和短线: 短线,乃至涨停板,是中线基础上的一次短促突击。 打个比方,如果说中线是臂力,那么短线就是腕力。腕力比臂力要快,但是腕力的本身依赖于臂力的功底。当然也有上来只打板的人,但是如果中线内功不修,短线腕力不练,涨停板手筋就不娴熟。 至于你说的情绪上分歧一致这些都是基本手筋了。我的中线判断力是很强的,只有在中线的基础上发现了短期机会,才可能找到合适的启动切入点。这是短线存在的要诀。 并不是操作快就是短线,短线必须有其存在的合理时间、空间。 如何提高攻击力? 当你能够控制亏损了,或者说持续稳定盈利了,自然就知道如何提高攻击力了。 所以等你持续稳定获利,再考虑收益率的事吧。 高手和菜鸟的区别: 区别在于每周、每月、每年持续一致赚钱的交易者耐心自律的执行交易。 龙头战法的精髓: ·守不败之地,攻可赢之敌 ·做龙头,大部分时间的最佳策略是空仓,不是试错,不需要嘛。 ·我认为龙头选手的问题,不是出在识别龙头,而是管不住手。 有个叫华舞的id,认知正确,说的也比较深刻。 ·龙头战法,没有强大的交易检验和自控是不能玩的。大多数人还是看看吧。 那些年看过的书: 无论是谁,都是从一无所知开始的。网络信息太碎片化了,交易是一门专业,还是需要系统的学为好。 如同其它行业一样,没有人能随随便便的成功,所有的成功都必须要付出一定的努力。我们能想象一个医生,道听途说一下、网络上学一下如何做手术,然后凭自己感觉,就可以给人开刀?又或者一个律师,不经过反复的学法律、研究案例,就可以帮别人打官司? 与其道听途说,自己在那瞎琢磨,或听不知哪的民间股神的神话,为何不去问问世界级专业交易者?看他们怎么操作可以持续稳定盈利,看看他们将十年以上经验写成书,花几十元买来学,值得吧? ·《笑傲股市》:众人皆知巴菲特、索罗斯,却对欧奈尔了解较少,一个我们这个时代的伟大的成长股投资大师。系统学者特别推荐,技术面+基本面,对散户很有可操作性,经典中的经典。 ·《股票作手回忆录》,投机祖师爷利弗莫尔,经典不用多说,龙头战法核心。没有最先推荐是个人认为这本书不适合新手,更适合对市场有很好的认知和理解的学。老徐翻烂了的书。 ·《金融怪杰》,主要记录了作者访谈的书本写作时期的顶级交易员,如罗杰斯、范撒普、欧奈尔、理查德丹尼斯等,深受华尔街交易员推崇。他们的交易策略、成长历程、交易心理、风险控制、资金管理等都会在书中体现。适合有多年交易经验的朋友看了会产生共鸣,也会有很大启发,因为很多困惑、痛苦与压力大都现实中遇到过。增加一个level,适合进阶。 看书后的感悟可以说说。一个朋友说在淘股吧最大的收获是对整个短线生态及各类交易模式有了全新认识,于我来讲《金融怪杰》这本书亦是如此,其内容要更加系统全面包括技术面、基本面、心理面、趋势交易、量化交易等等,尤其是当自己在交易中也遇到相似的问题时,可以说振聋发聩。不同位阶的人看完这本书会有不同的体会,学到不同的东西。 股票要系统的学,书本相比网络更系统全面,也许学起来略枯燥些。通过系统的学,加上反复的实战,得发展成一套适合自己的系统。每个人的心理特质不一样,适合的系统不一样。可以看看《金融怪杰》中一篇非常系统的访谈,stanely druckenmiller的top-bottom策略,根据索罗斯在《金融炼金术》中“里根大循环”中关于外汇反身性的判断,在德国马克外汇市场赢得的关键一役,应该会有很大启发。 ·《海龟交易法则》,唯一一个公开的实战的完整的交易模式,可以让你了解什么是模式。很多人看了之后也许会觉得太简单了,忍不住想,真的就这么简单?这其中的道理需要自己去悟! ·除了海龟,再补充几个久经考验的模式可以了解一下: 六点转向,利弗莫尔 CANSLIM,欧奈尔 箱体,达瓦斯 三重滤网,埃尔德 …… 超预期、弱转强,韭菜 《股票作手回忆录》中‘价格沿阻力最小的路线运动’如何理解并且应用于短线: 可以这么理解,顺着这条线的方向,几乎没有什么阻力的。 假设现在一直上涨: 1.提前进入的人都是赚钱的,不会有卖的念头; 2.而在场外还没进入的人,看着每天上涨,踏空的痛苦一直在心中,大致分两种心理:忍不住的和忍着的,忍不住(追涨、打板等)的就直接进去了。而忍着的(低吸、反抽等)也在等回调的机会进去; 3.这样一旦前面已经赚了不少的人忍不住先出来了(获利了结),股价暂时的回调,但场外的那些踏空的人马上蜂拥而上,于是股价马上又上去了; 4.而那些已经出来的人看着股价短暂回调后又继续猛涨,变成了新的踏空者,又等待时机加入。 如此循环,在这样的情况下,股价就会节节升高,偶尔的回调只是为了让它长得更高。因为所有人都在想买。一直到哪天大部分人手头都只有股票,而没有钱,形势才会发生变化。 交易之道: 悟道了,是超越了用技术分析寻找确定性的狭隘的思维方式,对技术分析有了新的认知和定位。心中有了概率思维,进而认识到市场的混沌特征,即两可性。有种“众里寻他千百度。蓦然回首,那人却在,灯火阑珊处。”的感觉。对“交易”有了更深刻的理解,认识到分析和交易是两回事,马说实践是检验真理的唯一标准,我说市场走势是检验分析的唯一标准。并真正做到顺势了:操作不再一根筋、固执己见、死不认错,讲究随市而动。单笔交易结果无论是亏损或者盈利,都心态平和,因为这是交易的一部分。交易,不再是预测,而是应对。关注做对事,而不是盈利,因为把事情做对,盈利只是副产品。简单的模式反复做。无它,惟手熟尔。一切皆自然……还要说什么?千言万语,欲说还休,一声叹息,天凉好个秋。够通俗了吧? 最后。世间之事,皆为无常。四句偈语,送给大家。 一切有为法, 如梦幻泡影, 如露亦如电, 应作如是观。 短线交易: 短线交易,是持仓时间短,不是胡乱的频繁操作,短线交易行为有着很大的交易成本,所以真正的短线高手恰恰是“行情好多做,行情不好多休息”,常在河边走哪有不湿鞋,在自己把握大的时候出手,迅速盈利出局才是短线。短线必须依托高胜率或赔率的交易模式才能稳定获利,否则就是绞肉机,所以任何想做短线的小朋友先“交学费”,不要想着上来就赚多少钱、翻多少倍,记住,一定要“坚持亏”,没有3-5年你根本不懂逆势重仓不止损叫什么。短线有人能成,有人不能成,不要纠结于手法,条条大路通罗马,不是手法的问题是使用手法的人的问题,个人观点。


DoNews:Flyme Auto 亮相并首搭领克 08 星纪魅族集团联合领克举行生态发布会

等待击球(2023-03-31 00:40:16)

国内AI大模型深度解读及发展机遇展望会议纪要–20230317

全文共计 7507 字

欢迎感兴趣的投资者联系中信计算机团队 杨泽原/黄思敏,纪要内容不代表中信证券观点。
-时间:2023年3月17日(周五)下午14:00-15:00
-嘉宾:某互联网公司AI大模型产品负责人
国内互联网大厂及AI厂商大模型进展和落地现状:
目前我们可以看到在这一轮ChatGPT所带来的语言大模型热潮,不但在全球领域,包括像OpenAI的ChatGPT、GPT1-4、Google 的LaMDA、PaLM以及Meta AI等。目前在海外的发展已经是非常火热。

国内发展情况:1)迎头赶上的趋势,大厂都在做积极投入,强势的应用也在积极酝酿中。包括昨天百度文心一言的发布。目前BAT、字节、华为等的国内大模型有很多令人期待的地方,比如21年年初发布的阿里通义M6大模型,是过千亿的中文参数语义大模型;去年10月发布的腾讯混元,也是破千亿的语言大模型,近日腾讯宣布要发布腾讯版的chatgpt,叫做腾讯混元助手。后续可能会在微信社交对话,广告广点通或者腾讯新闻内部的二方业务中有令人期待的落地。2)百度文心一言是国内首个语义大模型的终端应用,NLP技术上在国内处于第一梯队。昨天文心一言发布了关于数据层的信息、下游生态的展望与商业前景。相对处于先发优势地位。3)除了大型科技公司,包括二线厂商和start-up,比如玄机、360、京东(ChatJD)、AI四小龙(商汤、旷视)、国内高校或科研院所(复旦的MOSS、智源研究院悟道)都有比较好或者前沿的技术层投入。4)国内没有能直接对标chatgpt的应用,文心一言随着对公有云PaaS的调用,做付费的商用接口,下半年应用层的竞争格局会逐渐明朗。包括像创新搜索的业务场景,以及目前在海外很火热的应用产品,比如Jasper、微软基于GPT-4的office系列、Google的workspace。后续再国内应用层,比如办公、创作者工具、智能硬件、客服等领域会迎来强有力的竞争。
Q&A:
Q1:百度模型的状况是什么,性能上能对标GPT大概多少?
百度的ERNIE模型,最新是ERNIE 3.0,是在中文语义方面的大模型,参数量2600亿,性能表现上:1)文心一言主要是中文语义方面的应用,比如长语句、复杂语句、模糊指令等上游任务的理解能力还是非 常不错2)数学、逻辑推理方面有非常不错的表现3)多模态能力,包括text-to-text/text-to-image,这是相对GPT来说比较突出的一个点。GPT-4主要还是以text为主。整体的输入、中文理解领域,文心主要对标GPT-3.5。
Q2:哪些方面能达到3.5,哪些弱一些,哪些优秀一些?
从不同benchmark上对标:1)语言语种。ERNIE是local产品,文心所支持的语言语种理解以中文为主加小部分英文。面向的还是中文用户全体,chatgpt是global的大产品,主要支持英文,除了英文也支持中文,还支持德语、法语、西语、葡语、阿拉伯语,不仅支持语言学的知识,以及这些语言学下的各种区域性知识和事实性知识。就像昨天文心一言在秀遣词造句和古文的生成能力,是拥有中文语言的能力,chatgpt在多地区多语言下也有类似这种区域性知识。最大的benchmark差距点还是在支持的用户群体上,两者有很大的差别。2)中文语言下的功能,下游的知识生成和理解方面,从各渠道内部测评上,中文语义生成知识的内容准确性和丰富性,两者是在不同的feature上各有优劣,整体处在一个水平线上,ERNIE在遣词造句、引经据典、文本的丰富性和多样性上比chatgpt好。
多轮对话、连续对话的稳定、准确性,文心一言不如chatgpt,数理、逻辑推理、代码生成、补全查漏补缺,文心和chatgpt有差距。差距是因为chatgpt模型上线,用户数据持续不断回流,模型多轮迭代,模型表现变好。虽然文心发布较晚,但随着中文互联网环境上被用户不断使用是会持续迭代和变好的。Q3:未来商业化变现途径?
1)基于B端公有云服务,向下游商业生态进行技术赋能。主要的商业逻辑或者思路包括两大类,1)像 Openai将GPT模型家族的base模型部署到MicrosoftAzure云上做公有云的PaaS级产品,以未调用的API的方式在下游按生成量、按 token进行付费输出。后续文心一言在百度智能云或者是百度大脑上也有类似这种商业接口付费调用模式的计划。
2)行业或产业解决方案。国内央国企、大B、大K客户,对数据安全有布局要求,以项目制自由化交付,线下的客户caseby case收费。
2)C端业务场景。办公场景,比如Microsoftoffice、Googleworkspace,后续国内商业办公、商业文档等类似企业服务产品,或者对于new bing、news browser创新的搜索引擎,还有比如GPTPro会员付费模式、知识内容平台、内容营销服务平台、百度音箱、或者小米小爱这种结合了内嵌gpt版本产生的增强对话理解智能硬件产品,这种智能硬件产品也会有新的产品型号,或者是以硬件的采购或者消费类电子购买为主的商业形式。应用层的应用会非常多样。
Q4:定价大概在什么范围?比如GPT是0.02、0.03美金一千个token,转换到国内的定价范围大概是什么?包括b端c端整体的定价节奏?
Openai的GPT模型大概分成两种计价逻辑在Azure云上售卖:1)GPT的base模型,包括ada、babbage、curie、davinci这些的收费是按token,从0. 002 美金到0.02 美金,根据能力的不同进行标准的base模型收费。2)很多企业或行业,拥有自有专业数据或者知识库,有二次微调、二次精调的诉求,OpenAI也支持企业基于自己的数据或者知识进行二次三tuning之后,部署到Azure云上进行后续付费调用,这个会贵6-10倍左右。
2)国内类chatgpt或者大模型产品,我个人认为,成本上应该比openai再高一些,整体定价不会偏离openai在大模型行业的基准,不会比Openai GPT调用模型的使用成本有量级上的差别,可能会对标同期同类型的产品定价。尤其是今年上半年全球大模型产业化浪潮中,背后的商业逻辑会是前期以抢占份额为主,打价格战。比如国内大模型会根据0.02美金一千个token去抢占国内开发企业或者开发者用户的市场。
Q5:百度最核心的几块业务落地可能会在哪里?
1)C端。首先昨天文心语言已经开放邀请式注册,得到邀请码的小伙伴可以通过一言点百度.com的官网上,以页面程序的方式去和文心互动之外,后续在C端,1)第一个是百度的搜索,包括搜百科APP,作为DAU有接近 2.5亿的国民级APP,和大模型的结合场景还是非常丰富,还有像百度文库、学术都可以和大模型或者文心一言有很好的互动。可能会有增强版百度百科。以及在专业封闭的领域去做专业知识辅助写作与生成。在营销生成的场景,文心一言的文生图能力也能提高电商或广告营销的生产效率。2)智能硬件,百度有一个SLG-小度事业部,像小度智能音箱、小度运动健身镜或互动屏等一系列智能硬件,内嵌gpt的这种产品其实大幅度提高了终端用户对于现代 AI2.0 时代大模型本身的对话理解能力,后续比如音箱或机器人会迎来更多智能消费终端的升级。引领大家购买一些这种能力或者理解能力更强的对话类的新智能硬件类产品。
2)B端。像昨天Robin和王海峰王老师,更多强调百度的文心一言在产业级应用中非常有优势,甚至相比GPT也有很多优势。文心更多主打产业级的趋势增强大模型,因为文心之前有很多基于百度智能云服务的各种B端客户,像昨天发布会讲解的能源电力、金融银行、融媒体等各种产业级的数据和大模型应用能力。后期首先会结合文心已宣布的四五百家生态伙伴去赋能千行百业的对于知识、搜索后对话有诉求的专业场景,另外也会对现有B端产品做能力提升,比如智能客服、理财助手、知识图谱、新闻智能采编、媒体审核、商用文档、商用PDF,后续有很多新的产业级赛道出现。
Q6:国内厂商投入的意愿和力度?1)无论是海外的Openai的GPT、Google以Bert为基础的PaLM、LaMDA,虽然openai没有把GPT-4在整体训练过程中涉及的专利、参数体量、数据情况披露出来,但以GPT-3为例,一个base模型为成本投入举例来看,目前GPT-3投入的10000张NvidiaV100高端算力芯片卡,V100 2020年市价8-10万人民币左右,像目前的高端算力芯片卡A800 应该也是差不多价格,折合十亿人民币左右。它代表行业内想training出来好的、比较通用的,效果比较完整且丰富的通用技术模型的算力投入。对国内而言中位数水平可能需要10-20亿的算力投入。2)另外大模型在生产层的三个要素:算力、算法、数据,算法科学家,背后比拼的是LP 的脑力密集程度,就是 LP 的算法工程师和算法科学家像openai作为初创公司,nlp算法人员有100多人,国内start-up作出这种产品至少需要100名左右senior工程师。3-5、5-8年的工程师年薪在100万人民币左右,人员开支1-2亿。4)数据上的cost包括百度的文心一言背后的raw data 源数据可能更多的还是from像搜索、百度的feed这些自有的业务数据,这些是十几年累积下来的,本身一次性投入的数据cost不会那么多。但是对于初创团队,如果自己没有base数据,采购成本是比较高的。如果仅仅依赖包括像OPEN AI或者Google 已经开源源码或者数据集,模型效果肯定不会特别令人惊艳,或者是在市场级的业务有缺失。所以在数据侧投入上,数据成本可能很低也有可能很高,比如做一些生命科学的大模型成本可能非常高。以此类比,去做相对来说比较好的beta版本大模型,可能一次性投入至少20- 30亿左右。国内目前而言,主要还是若干个大厂的游戏,包括刚才已经举例的若干个大厂的模型,都是逐年投入的结果。
Q7:各家大厂有犹豫的吗?
目前第一梯队的大厂还都是战略级定位,在持续投入。
Q8:追上微软嵌入所有应用的能力需要多久?
包括昨天发布的Office365,还有pilot这些产品,一方面是有潜力的大模型,基于GPT3、
4。其次它有非常丰富的业务场景,office用户几十亿,用户本身就是偏量级的。如果境内想要做出来比较完美的商业闭环,首先上游需要有一个潜力还不错的基础模型,像百度的文心,或者是像阿里的通义、腾讯的混元。基础模型不能太差,即使是会有缺失或者都可以是以用代研方式逐步累积迭代出很好的模型。关键是下游业务场景有没有像类似 office或者像Googleworkspace这种有偏量的用户,能够持续不断为模型迭代去打磨比较好的技术土壤,产品要有足够好的使用地方。这对国内很多产品来说是业务的天堑,尤其对于二线厂商或者start-up来说更是天堑。后续也只有像若干个大厂,基于自己本身存量的业务,快速迭代出性价比非常高的、普适性的AI大模型产品,类似搜索和音箱之于百度,电商和钉钉之于阿里,或者社交和文娱游戏之于腾讯一样。类似像文档、邮件、CRM或者SCRM 这种大的服务对于国内的商业场景来说,是分散在一些其他垂直赛道的头部玩家的情况,后续会不会有垂直赛道的头部玩家和AI技术大厂去结合的这种情况也是非常令人期待的。
Q9:在今年或者明年会表现出不错的表现吗?
快的话会在今年下半年或者明年上半年。因为chatgpt、new bing上线时都是不完美的,所谓global的大模型,这一轮大模型产品都是以用代研,首先抢先发布,随着用户体量的增多、业务数据回流去逐步迭代大模型表现,因为大模型AI类应用产品的特色或者特性就是如此,它和上一代的中模型或者小模型以及更早的IP 的应用程序不同的是,它的产品体验和表现存在着巨大的不确定性。这些巨大不确定性是需要将产品进行上线以用户的规模或者用户持续不断使用和体验去逐步打磨。现在是大幕拉开的情况,后续文心随着智能云和百度大脑开放商用接口,肯定是有源源不断的商用产品或者应用产品出现,上线之后会抢占市场、业务空间,不断迭代让它有更好的体验,而不是十年磨一个大招再上线完美的产品,这个是不符合现在的大模型产品的商用逻辑。
Q10:为什么昨天两位领导不是特别自信?
我认为大家对于整体的文心的期望值,无形中有了一个很高的benchmark,benchmark就是前天的GPT-4,它所表现的一些理解能力上,国内的大模型产品和GPT-4比起来还是有很大能力差异。GPT-4目前在整个prompting支持长达2. 5万个token的输入。对于像包括文心或其他一些产品目前支持理解的最大的长度是在几千字,对标 GPT-3的水平。
Robin是百度第一代工程师,百度第一代搜索引擎就是robin写的,包括王老师也是业内知名专家,大家可能还是保持谦逊的态度,没有去吹嘘或者夸耀产品。但是对于外行来说,可能觉得产品都很烂,但是随后我们在昨天晚上对文心一言内测的直播过程中,其实文心在很多方面的表现还是非常不错的,甚至一些包括像图文场景其实比 ChatGPT表现还要好,也超出很多人的预期。所以包括今天股市上其实也反映出来了。
Q11:百度文心的透明度和gpt-4还是有区别?文心一言有没有RLHF功能?
文心主要还是对标GPT-3.5,base模型是GPT-3,昨天王海峰老师也介绍,它加入了一部分人类反馈的强化学习机制。昨天更多还是录制原因,因为整体的prompt输入和打字过程还是比较长,也是为了控场所以提前录制,现场的演讲效果相对来说不太理想,大家可能基于这点觉得文心一言的能力非常弱。在昨天晚上的各个媒体的大v和大量网友真实互动中,网友对文心提的问题也很刁钻,包括代码的生成和查漏和补全等,其实文心的表现还是比较不错的,所以并不是代表它比GPT-3.5 弱多少,和4还是没有办法比,无论是对于一些超长输入的理解、专业的学术领域论文的理解、通过玩梗图去深层表现它对于图
像的理解能力都是非常强的。可能目前文心还没有办法和GPT-4直接对标。
Q12:文心也是像GPT-4一样它分三个步骤,一个是预训练模型,第二个是奖励模型,再用强化学习?主要的差异是因为我们用的标注的人,OPEN AI据说是用了 1000个博士去做?
三个步骤一模一样。没那么多,是40到50 人左右,博士级别的标注团队去做奖励模型。一个大模型从数据的训练分为两部分,1)第一部分是在预训练阶段,需要各种各样大量数据标注工作,包括像清洗、分词、转译等等。Open AI之前也爆出在非洲、东南亚用大量廉价劳动力去做这部分质量比较低,但是劳力密集程度比较高的预训练数据标注的工作,这个是发生在GPT-3这种base model上。在21 年和22 年的Instruct GPT做了一个人类强化RLHF方法,具体做奖励模型,主要是open AI自己的产研上去排prompt、写答案、
排序和评分,建立奖励机制。
Q13:是不是只要百度的标注时间足够长,模型也会逐渐优化?
对。它其实是技术工程的概念。因为我们知道仅仅就搜索而言,其实搜索的这些用户的query的范围是非常广的,需要不断优化它拓宽覆盖的domain,它就会越来越好。
Q14:微软发布的新产品如果在中文版office使用,可能因为中文语料的问题导致跟国外有差异?
应该是会有一些差异,1)国内因为监管政策的原因,其实GPT产品是没有进来的。微软如果想要进入到中国市场,面临的第一道关就是网信办的内容监管的红线问题。因为GPT-3、GPT-4的raw data训练数据叫WebText,里面有大量所谓的加引号的封闭rawdata,比如像 wikipedia的政治还有公众人物评价或者其他,在国内是绝对不过审的。如果微软想要迎合中国市场,可能需要做一个中国特供版的basemodel。至于basemodel,它要不要做,花多少决心和成本去做是第一个问题。2)微软还需要在国内有代运营或者代理的公司,处理一系列国内的应用层或者法务层的各种工作。我觉得如果要做,也是以GPT为basemodel,再去升一个中文版的分支,肯定从产品效果和表现上,还是和global版会有很大的差异。Q15:比如电脑上已有的工作文档,微软是不是相当于是把已有的工作文档作为对prompt的修改结合到模型里面去?
从目前披露的一些公开信息上来看,是这样的。
Q16:国内厂商用GPT是不是会同样遇到中文语料有限制的问题?
对,应该不能直接去用,尤其是比较大的商业公司。如果是小公司,翻着墙偷摸去用应该也还好,但是比较严肃的商业公司应该不会。
Q17:文心一言昨天展示的直接生成视频能力看起来还是比较超出产业平均水平,当时它是基于现场演示的影视资料就能自动生成吗,能不能展开介绍?
目前对于视频创作的一些领域或者业务场景相对来说还是比较受限。因为它不是脱离基础的媒资库或者媒资资源进行凭空闪样或者空中阁楼的构造,更多还是依赖后端的媒资库资源池以及特定业务场景。目前可能所支持的包括创作、营销的场景,相对来说是比较受限的。支持的广泛性上,比如支持的风格、业务场景,大家还需要再等一等。它不是文生图那种直接用diffusion model从0开始做,还是依赖一些媒资资源。
Q18:国内大厂现在的技术路径是和Openai一样还是会用其他家的?
业内早几年主要对标的Bert,因为早几年Bert在LP 领域影响力是非常大的,或者说是独树一帜的。应该是从21年开始,基于GPT的promptlearning 技术范式才逐步展开。
Q19:除了百度,其他几家能看到C端类似的产品吗?
目前还未知,从战略高度上,比如如果是张勇站台或者是Pony出来站台做大模型产品,目前我们看不出其他家有这么高的战略定位。
Q20:国内各家大模型第一梯队?第二、三梯队?
第一梯队是百度、阿里、腾讯、字节、华为,第二是京东、讯飞、商汤、360和其他。


徽财:新华保险2022年保费收入1631亿元 续期保费占比超70%

徽财:在服务实体经济和满足人民美好生活需要中实现高质量发展

IPO早知道:京东工业招股书披露客户结构:在华全球500强覆盖超40%

券商中国:买买买!全球央行抢购黄金,股票、期货齐涨!未来金价怎么看?

原标题:国联证券-电力设备与新能源行业深度研究:风电深度系列-一-:向海而兴,乘风破浪-230203
下载报告