AI 硬件投資熱,兒童方向被看好,AIGC 玩具陪伴孩子成長(zhǎng) | 對(duì)話躍然創(chuàng)新

精準(zhǔn)學(xué)推出中國首個(gè)語音端到端大模型,助力 AI 輔學(xué)體驗(yàn)更上一階
新技術(shù)將很快應(yīng)用于精準(zhǔn)學(xué)的 AI 輔學(xué)機(jī)上,深圳灣的讀者也將在 9 月份的 AI 硬件線下交流活動(dòng)上,很快體驗(yàn)到這項(xiàng)技術(shù)突破成果。
做 AI 硬件,關(guān)隘不在硬件在 AI,做 AI 輔學(xué)硬件,端到端的 AI 語音交互尤為關(guān)鍵。正如 GPT-4o 扮演老師角色,讓可汗學(xué)院創(chuàng)始人薩爾·汗和他的兒子伊姆蘭也驚艷于它的數(shù)學(xué)題解答和教學(xué)能力。

雖然 GPT-4o 能力很強(qiáng),但一直以來,開源社區(qū)缺少中文為主的高質(zhì)量語音 Codec 和自監(jiān)督預(yù)訓(xùn)練 Encoder 基礎(chǔ)設(shè)施,讓很多有計(jì)劃使用 AI 大模型做教育應(yīng)用的企業(yè)很難在對(duì)話體驗(yàn)上實(shí)現(xiàn)突破。
深圳灣 8 月 23 日消息,來自浙江的教育科技公司精準(zhǔn)學(xué)宣布,公司已在 AI 語音交互技術(shù)上取得領(lǐng)先性的突破,成功訓(xùn)練了中國首個(gè)語音端到端大模型「心流知鏡-s(V02)」,它可以直接實(shí)現(xiàn)「語音輸入-語音輸出」的交互,在適配輔學(xué)場(chǎng)景后,大模型可以生成更加自然的對(duì)話交流體驗(yàn),讓 AI 達(dá)到「真人老師」級(jí)別。

精準(zhǔn)學(xué) AI 實(shí)驗(yàn)室從零開始訓(xùn)練,使用端到端語音結(jié)構(gòu),避免了級(jí)聯(lián) ASR+LLM+TTS 方式額外延遲,同時(shí)也更好的改善純文本模型損失的情感節(jié)奏等豐富信息,讓 AI 語音交互更加接近人類的對(duì)話體驗(yàn)。
為回饋開源社區(qū),精準(zhǔn)學(xué)還將提供時(shí)間表,逐步開放基礎(chǔ)模型,供學(xué)術(shù)和非商用使用,為科研和技術(shù)探索作出貢獻(xiàn),促進(jìn) AI 語音技術(shù)更好的服務(wù)于社會(huì)。
今年 5 月,精準(zhǔn)學(xué)曾獲得阿里 2 億元融資。次月,精準(zhǔn)學(xué)首個(gè)原生代 AI 輔學(xué)機(jī) Bong 系列上架銷售,主打 AI 老師一對(duì)一輔學(xué)功能,這也是行業(yè)內(nèi)首次有產(chǎn)品繞過助手工具,正面提供一對(duì)一的 AI 輔學(xué)功能。

此次發(fā)布的語音端到端大模型也將很快應(yīng)用于精準(zhǔn)學(xué)的 AI 輔學(xué)機(jī)上,深圳灣的讀者也將在 9 月份的 AI 硬件線下交流活動(dòng)上,很快體驗(yàn)到這項(xiàng)技術(shù)突破成果。
主筆:周森 / 深圳灣