人工智能讲解员

-LLM+Lora高效微调+RAG

project
  • 核心技术

    LLM(大型语言模型)+LoRA(低秩适应)+RAG(检索增强生成)

模块

语音交互模块 基于whisper+FunASR

icon

加入语音交互的目的:

除了传统的打字询问,为了更加便捷地查询以及照顾某些特殊人群,我们特意为程序内置了语音提问模块

icon

whisper:

Whisper 在处理噪声环境下的语音时表现出色,即使在背景噪声较大的环境下,它也能较好地提取并识别语音内容。这个特点使得它特别适合在这种略显嘈杂的场合中使用。

icon

FunASR:

因为只能讲解员的特殊性,程序响应速度尤为重要,而FunASR 具有实时语音识别能力,可以进行低延迟的语音转录,适用于这种需要实时反馈的场景。

我们的优势一

硬件需求低:

1台主机+若干终端

局域网主机需要为一台双24G显卡的主机,主要用于处理各个终端发过来的请求。

连接局域网的其它终端只需是普通电脑,基本没有硬件方面的硬性要求,主要用于面对客人进行问答。

seo
seo
我们的优势二

运行环境简单:

本机+局域网部署

本机部署:将程序部署在本地计算机或服务器上,意味着数据存储和处理几乎完全在用户的物理控制范围内。用户可以控制硬件、操作系统及应用层的安全措施,减少外部因素的影响

局域网隔离:局域网(LAN)通常是一个物理上相对隔离的网络,尤其是在没有直接连接外网的情况下。局域网内的设备通常通过路由器或防火墙等设备与外部网络进行隔离,从而有效降低外部入侵的风险。