(资料图)
用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。最近的一项研究显示,由于 OpenAI 等服务所采用的服务器成本衡量和计费的方式,英语输入和输出的费用要比其他语言低得多,其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。
IT之家注意到,推特用户 Dylan Patel(@dlan522p)分享了一张照片,展示了牛津大学进行的一项研究,该研究发现,让一个 LLM 处理一句缅甸语句子需要 198 个词元(tokens),而同样的句子用英语写只需要 17 个词元。词元代表了通过 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)访问 LLM 所需的计算力成本,这意味着缅甸语句子使用这种服务的成本比英语句子高出 11 倍。
词元化模型(即人工智能公司将用户输入转换为计算成本的方式)意味着,除了英语之外的其他语言使用和训练模型要贵得多。这是因为像中文这样的语言有着不同、更复杂的结构(无论是从语法还是字符数量上),导致它们需要更高的词元化率。例如,根据 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中只需要两个词元,但在简体中文中需要八个词元。尽管简体中文文本只有 4 个字符(你的爱意),而英文有 14 个字符。
标签:
用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造
7月31日10点53分,房地产开发板块指数报14329 91点,涨幅达4%,成交272
7月28日,光启技术(002625)融资买入950 67万元,融资偿还1398 73万元
云南信息报讯云上融媒记者徐蓉7月27日至29日,云南省消防救援总队2023
24小时财经资讯平台,依托新锐财经日报《每日经济新闻》(NationalBusin
本文转自:人民日报客户端徐靖7月30日,记者从合肥市公安局交警支队了
31省份上半年GDP全部出炉:15省份增速跑赢全国,13省份增速超6%
路透社7月30日消息,乌克兰总统办公室主任叶尔马克30日在其Telegram频
1、“作”,现代汉语规范一级字(常用字),普通话读音为zuò,最早见
8月份,进入2023年车市的下半场,各大汽车品牌继续拼销量,抢市场。其
7月30日, 原来微信可以防拉黑 登上了热搜第一。很多人不知道怎么设置
战全纪录电视剧,越战全纪录这个问题很多朋友还不知道,来为大家解答以
从高山之巅到驰骋深蓝、从边防哨所到浩瀚星河,无数平凡的人、普通的事
首旅集团召开干部大会7月29日,首旅集团召开干部大会,宣布北京市委、
7月30日,第31届世界大学生夏季运动会男子50米步枪三种姿势团体决赛在
中央气象台30日6时继续发布暴雨红色预警。预计,30日8时至31日8时:河
▲向群众宣传防溺水知识。摄影∣通讯员喻美君江西新闻客户端讯(江西日
可能有许多遗迹2用户不知道遗迹2无形者的地下室门后戒指获得方法攻略,
根据最新数据,截至2023年7月29日11时22分,暑期档(6月1日-8月31日)
各位网友们好,我是编辑小夏,为大家解答什么是超线程,超线程是哪个公
东四国风静巷微信公众号根据《北京市防汛紧急预案》,本市已发布防汛红
编者按:杭州第19届亚运会将于9月23日正式开幕,随着赛事日益临近,亚
2023年7月30日海南省南瓜批发市场价格最新行情监测显示:2023年7月30日
HELLO,我是智能手机网小溪,我来为大家解答以上问题。泰勒斯威夫特经
干不过保安的资本大鳄姚振华老师,最近又输了一场官司。29日,上市公司
各位网友们好,我是编辑小夏,为大家解答歌曲hero英文歌词,歌曲hero歌
,你们好,今天0471房产来聊聊一篇牙街道办事处,牙街道办事处简述的文
1、性能非常不错,jeep的品牌也很不错对不到30万的说指南者是城市suv,
App7月29日消息,北京市气象台已发布暴雨红色预警,为保障安全,按有关
文 水清清北京时间7月29日,广东与浙江的热身赛进行至首节最后时刻,不
Copyright © 2015-2022 全球服装网版权所有 备案号:豫ICP备20009784号-11 联系邮箱:85 18 07 48 3@qq.com