3月30日,阿里千问宣布全模态大模型Qwen3.5-Omni上线。该系列包括Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文。Qwen3.5-Omni能够处理超过10小时的音频输入及超过400秒的720P(1 FPS)音视频输入。此外,它支持113种语种和方言的语音识别以及36种语种和方言的语音生成。用户可以通过Offline API和Realtime API体验这一功能。
3月30日,阿里千问宣布全模态大模型Qwen3.5-Omni上线。该系列包括Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文。Qwen3.5-Omni能够处理超过10小时的音频输入及超过400秒的720P(1 FPS)音视频输入。此外,它支持113种语种和方言的语音识别以及36种语种和方言的语音生成。用户可以通过Offline API和Realtime API体验这一功能。