从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用!

下次还敢
发布: 2025-07-16 10:17:24
原创
335人浏览过
星河社区大模型 API 服务背靠百度智能云千帆平台,提供文心大模型能力,兼容 openai-python SDK。含文本、图像、词向量生成及函数调用等功能,支持 ERNIE 系列等文本模型、Stable Diffusion XL 图像模型及 embedding-v1 等向量模型。需访问令牌和 Tokens,提供多种调用示例,助力开发提效。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

从0到1上手星河社区大模型api服务-新增ernie-4.5多模态调用! - php中文网

什么是星河社区提供的大模型API服务?

  • 星河社区提供的大模型API服务是为开发者提供的一套基础的大模型 API 服务,背靠百度智能云千帆平台,提供文心大模型能力。

  • 该大模型 API 服务兼容openai-python SDK,开发者可以直接使用原生的 openai-python SDK来调用文心大模型服务。

从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用! - php中文网

本项目将带你了解大模型API服务基本用法,包含文本生成&图像生成&词向量生成&函数调用等功能,助力开发提效!

支持的模型

文本模型

模型名称 传入model参数名 特点 适用场景
ERNIE 4.5(8k) ernie-4.5-8k-preview - 最强大的文心多模态系列模型
- 支持8k上下文
- 多模态理解能力强
- 通用任务
- 多模态理解
deepseek-r1 deepseek-r1 - 强大的推理模型
- 支持8k上下文
- 推理能力强
- 复杂任务
- 长文本理解
ERNIE 4.0 Turbo (128k/8k) ernie-4.0-turbo-8k/ernie-4.0-turbo-128k - 最新旗舰模型
- 支持128k/8k上下文
- 推理能力强
- 复杂任务
- 长文本理解
- 创意写作
ERNIE 4.0 (8k) ernie-4.0-8k - 推理能力强
- 文本推理
- 文本理解
- 日常对话
- 文本生成
- 通用任务
ERNIE 3.5 (8k) ernie-3.5-8k - 性能稳定
- 响应速度快
- 成本适中
- 日常对话
- 文本生成
- 通用任务
ERNIE Speed (128k/8k) ernie-speed-8k/ernie-speed-128k - 极速响应
- 支持长文本
- 资源占用低
- 实时交互
- 简单问答
- 批量处理
ERNIE Lite/Tiny (8k) ernie-lite-8k - 轻量级模型
- 资源占用最少
- 速度最快
- 移动端应用
- 简单任务
- 对话机器人

图像模型

模型名称 传入model参数名 特点 支持的风格
Stable Diffusion XL Stable Diffusion XL - 高质量图像生成
- 多种艺术风格
- 精确控制
- Base (基础风格)
- Anime (动漫风格)
- 3D Model (3D建模)
- Photographic (摄影风格)
- Digital Art (数字艺术)
- 更多风格...

向量模型

模型名称 传入model参数名 嵌入维度 size数量 单文本字符长度
embedding-v1 embedding-v1 384 16 1000
bge-large-zh bge-large-zh 1024 512 2000

准备

访问令牌

访问令牌用于 AI Studio 用户进行身份验证,可通过访问令牌向 AI Studio 执行授权范围(如大模型 API 的调用权限,仓库相关的读取访问权限等)指定的特定操作。可前往个人中心的 访问令牌页面 查看个人专属 access token。

Tokens

Tokens 为星河社区上调用大模型SDK或使用大模型应用的最终计量单位,星河社区为每个开发者提供了100万的免费 Tokens 额度。开发者使用不同的模型会扣除不同数量的Tokens,Token 收支明细可查看使用明细。若Tokens 已消耗完,可购买 Tokens 后再使用。

服务域名

用星河社区提供的大模型 API 服务的域名地址: https://aistudio.baidu.com/llm/lmapi/v3

在使用 openai-python 调用星河大模型 API 服务时,需要将

指定 api_key = "令牌(Access Token)"

指定 base_url = "https://aistudio.baidu.com/llm/lmapi/v3"

环境准备

In [ ]
!pip install openai pillow requests IPython
登录后复制

配置访问令牌

请先在AI Studio访问令牌页面获取access token,然后运行:

百灵大模型
百灵大模型

蚂蚁集团自研的多模态AI大模型系列

百灵大模型 177
查看详情 百灵大模型

从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用! - php中文网

In [11]
from openai import OpenAI  # OpenAI SDK主要库from IPython.display import display, Image  # 用于在notebook中显示图片import requests  # 用于下载图片import json  # 用于处理JSON数据api_key = "在这里填写你的访问令牌" # https://aistudio.baidu.com/account/accessTokenclient = OpenAI(
    api_key=api_key,
    base_url="https://aistudio.baidu.com/llm/lmapi/v3" # 星河社区大模型API服务的BaseURL)
登录后复制

新增支持ERNIE-4.5多模态能力调用,快来试试吧!

In [4]
#多模态-文字输入import osfrom openai import OpenAI

completion = client.chat.completions.create(
        model="ernie-4.5-8k-preview",
        messages=[
            {                'role': 'user', 'content': [
                    {                        "type": "text",                        "text": "介绍几个北京著名景点"
                    }
                ]   
            }
        ]
    )print(completion.choices[0].message.content or "")#流式输出:#for chunk in completion:#    if (len(chunk.choices) > 0):#        print(chunk.choices[0].delta.content, end="", flush=True)
登录后复制
北京作为中国的首都,历史悠久、文化底蕴深厚,拥有众多著名景点。以下是几个具有代表性的景点介绍:

### 1. **故宫博物院**
   - **简介**:位于北京市中心,是中国明清两代的皇家宫殿,也是世界上现存规模最大、保存最完整的木质结构古建筑群。
   - **特色**:
     - 占地面积约72万平方米,拥有9000多间房屋。
     - 珍藏大量文物,如《清明上河图》、青铜器、陶瓷等。
     - 建筑风格融合了中国传统建筑艺术的精华,如太和殿、乾清宫等。
   - **建议**:游览时建议提前预约门票,并预留充足时间参观。

### 2. **天安门广场**
   - **简介**:位于北京市中心,是世界上最大的城市广场之一,也是中国重要的政治和文化象征。
   - **特色**:
     - 广场中央矗立着人民英雄纪念碑和毛主席纪念堂。
     - 周边有中国国家博物馆、人民大会堂等重要建筑。
     - 每日清晨的升旗仪式和傍晚的降旗仪式吸引大量游客。
   - **建议**:参观时需遵守广场规定,注意安全。

### 3. **长城(八达岭、慕田峪等)**
   - **简介**:长城是中国古代伟大的防御工程,北京段以八达岭和慕田峪最为著名。
   - **特色**:
     - 八达岭长城地势险要,建筑雄伟,是明长城的精华部分。
     - 慕田峪长城以秀美著称,游客较少,适合徒步和摄影。
     - 长城四季景色各异,春秋两季尤为迷人。
   - **建议**:穿着舒适的鞋子,注意天气变化,可选择缆车或徒步攀登。

### 4. **颐和园**
   - **简介**:中国现存最大的皇家园林,位于北京西郊,以昆明湖和万寿山为主要组成部分。
   - **特色**:
     - 园林设计融合了江南水乡的婉约与北方皇家的大气。
     - 著名景点包括长廊、十七孔桥、佛香阁等。
     - 春季的樱花和秋季的枫叶是摄影爱好者的天堂。
   - **建议**:可乘船游览昆明湖,感受园林的宁静与美丽。

### 5. **天坛公园**
   - **简介**:明清两代皇帝祭天、祈谷的地方,是中国现存最大的古代祭祀建筑群。
   - **特色**:
     - 主要建筑包括祈年殿、回音壁、圜丘等。
     - 祈年殿的圆形建筑象征“天圆地方”,是中国古代建筑艺术的杰作。
     - 公园内古树参天,环境清幽,适合散步和休闲。
   - **建议**:清晨或傍晚时分游览,可避开人流高峰。

### 6. **圆明园**
   - **简介**:曾被誉为“万园之园”,是清代皇家园林,1860年被英法联军焚毁。
   - **特色**:
     - 遗址公园内保留了大量残垣断壁,见证了历史的沧桑。
     - 西洋楼景区是圆明园中唯一基本保持原貌的区域。
     - 园内有大片水域和植被,四季景色各异。
   - **建议**:参观时可结合历史背景,感受其文化价值。

### 7. **南锣鼓巷**
   - **简介**:北京最古老的街区之一,保存了元大都时期的胡同格局。
   - **特色**:
     - 胡同内有许多传统四合院和特色小店。
     - 融合了老北京文化与现代商业,是体验北京胡同文化的绝佳地点。
     - 美食众多,如老北京炸酱面、豆汁儿、糖葫芦等。
   - **建议**:傍晚时分游览,可感受胡同的烟火气。

### 8. **奥林匹克公园**
   - **简介**:2008年北京奥运会的主会场所在地,包括鸟巢(国家体育场)、水立方(国家游泳中心)等标志性建筑。
   - **特色**:
     - 鸟巢和水立方的现代建筑设计令人震撼。
     - 公园内有广阔的绿地和景观,适合休闲和运动。
     - 夜晚灯光璀璨,是拍照打卡的好地方。
   - **建议**:可参观奥运博物馆,了解奥运历史。

### 9. **798艺术区**
   - **简介**:原为工厂区,现改造为当代艺术聚集地,充满艺术气息。
   - **特色**:
     - 聚集了大量画廊、艺术工作室和创意店铺。
     - 经常举办艺术展览和文化活动。
     - 建筑风格独特,融合了工业与现代艺术元素。
   - **建议**:适合喜欢艺术和摄影的游客。

### 10. **北海公园**
   - **简介**:中国现存最悠久、保存最完整的皇家园林之一,位于北京市中心。
   - **特色**:
     - 以琼华岛和白塔为中心,湖光塔影,景色宜人。
     - 曾是清代皇家的避暑胜地。
     - 园内有许多古建筑和碑刻,文化底蕴深厚。
   - **建议**:可乘船游览,感受皇家园林的宁静与美丽。

### 总结
北京的著名景点涵盖了历史、文化、自然和现代艺术等多个方面,无论是喜欢古迹的游客,还是偏爱现代建筑的旅行者,都能在这里找到心仪的去处。建议根据兴趣和时间安排,选择几个重点景点深入游览,同时体验北京的传统美食和胡同文化,感受这座城市的独特魅力。
登录后复制
In [6]
#多模态-图片输入(URL)import osfrom openai import OpenAI


completion = client.chat.completions.create(
        model="ernie-4.5-8k-preview",
        messages=[
            {                'role': 'user', 'content': [
                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image1.jpg"
                        }
                    }
                ]   
            }
        ],
        stream=True,
    )for chunk in completion:    if (len(chunk.choices) > 0):        print(chunk.choices[0].delta.content, end="", flush=True)
登录后复制
这是一幅自然风景图,画面展现了一条蜿蜒的木质栈道穿过一片广阔的绿色草地。栈道两侧是茂盛的草丛和一些低矮的灌木,远处可以看到一片树木,天空湛蓝,点缀着几朵白云,整体氛围宁静而美丽。

可以从以下几个方面用英语描述这幅图:

1. **栈道 (Boardwalk)**:
   - A wooden boardwalk winds through the lush green field, inviting visitors to explore the natural landscape.

2. **草地 (Grassland)**:
   - The grassland is vibrant and green, stretching out on both sides of the boardwalk, creating a serene and picturesque scene.

3. **植被 (Vegetation)**:
   - Various types of grasses and low shrubs dominate the area, with a line of trees visible in the distance, adding depth to the landscape.

4. **天空 (Sky)**:
   - The sky is a brilliant blue, dotted with a few fluffy white clouds, enhancing the overall tranquility of the scene.

5. **整体氛围 (Overall Atmosphere)**:
   - The image exudes a sense of peace and natural beauty, making it an ideal spot for a leisurely walk or simply enjoying the outdoors.

综合起来,可以用以下段落描述这幅图:

This image captures a serene natural landscape featuring a wooden boardwalk that winds through a vibrant green grassland. The lush vegetation, including various grasses and low shrubs, stretches out on both sides of the path, leading to a line of trees in the distance. The sky above is a brilliant blue, dotted with a few fluffy white clouds, adding to the overall tranquility of the scene. This picturesque setting invites visitors to take a leisurely walk and enjoy the beauty of nature.
登录后复制
In [ ]
#多模态-图片输入(base64)-流式import osfrom openai import OpenAIdef encode_image(image_path):
    with open(image_path, "rb") as image_file:        return base64.b64encode(image_file.read()).decode("utf-8")        
# Path to your imageimage_path = "/image_1.png" #这里要上传自己的图片并添加路径,不然会报错# Getting the Base64 stringbase64_image = encode_image(image_path)


completion = client.chat.completions.create(
        model="ernie-4.5-8k-preview",
        messages=[
            {                'role': 'user', 'content': [
                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image1.jpg"
                        }
                    }
                ]   
            }
        ],
        stream=True,
    )for chunk in completion:    if (len(chunk.choices) > 0):        print(chunk.choices[0].delta.content, end="", flush=True)
登录后复制
In [8]
#多模态-图片+文本输入-流式import osfrom openai import OpenAI

completion = client.chat.completions.create(
        model="ernie-4.5-8k-preview",
        messages=[
            {                "role": "user",                "content": [
                    {                        "type": "text",                        "text": "图片里有什么?这两张图片有什么不同?请用中文回答"
                    },
                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image1.jpg"
                        }
                    },
                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image2.png"
                        }
                    }
                ]
            }
        ],
        stream=True,
    )for chunk in completion:    if (len(chunk.choices) > 0):        print(chunk.choices[0].delta.content, end="", flush=True)
登录后复制
图片1展示的是一片自然景观,有一条木板路穿过茂密的绿色草地,背景是蓝天和一些树木。图片2展示的是一个人正在用手指触碰一个手工制作的物品,这个物品似乎是由绿色和蓝色的材料制成,有类似植物和动物的形状。

这两张图片的不同之处在于:
1. 图片1是自然景观,而图片2是人工制作的物品。
2. 图片1展示的是户外的广阔场景,而图片2是一个特写镜头,聚焦于手工物品的细节。
3. 图片1没有人出现,而图片2有一只手在触碰物品。
4. 图片1的颜色主要是自然的绿色和蓝色,而图片2的颜色虽然也有绿色和蓝色,但更多的是材料的色彩和质感。
登录后复制

注意:

大模型每一次调用都是无状态的,您需要自行管理传入给模型的信息。如果需要模型多次理解同一张图像,请在每次请求时都传入该图。

支持单图和多图,每一张图片大小不超过10MB,多张图片输入的总token不超过模型上下文长度。如ERNIE-4.5模型,不超过8K token的图片输入。

图片格式:

a. 图片base64:JPG、JPEG、PNG和BMP类型,传入的格式需为:data:image/<图片格式>;base64,<Base64编码>

b. 图片公网url:支持JPG、JPEG、PNG、BMP和WEBP类型

使用方法详解

1. 文本生成

基础对话

让我们从最简单的对话开始:

In [3]
# 基础文本生成示例# 这是最简单的API调用方式,适合单轮对话场景response = client.chat.completions.create(    # messages是一个列表,包含对话历史
    messages=[
        {            'role': 'user',  # 角色可以是user(用户)、assistant(AI)或system(系统提示)
            'content': '写一首关于春天的诗'  # 具体的对话内容
        }
    ],
    model="ernie-3.5-8k",  # 选择使用的模型,这里使用的是ernie-3.5-8k)# 从响应中获取生成的内容print("AI创作的诗:\n")print(response.choices[0].message.content)  # choices[0]表示第一个(也是唯一的)回复
登录后复制
AI创作的诗:

春日
春日融融万物苏,柳丝轻拂绿波湖。
桃花含笑迎新客,燕子衔泥筑旧屋。
风暖花红春意满,雨酥草嫩景色足。
一年好景在此时,莫负春光莫负吾。
登录后复制

多轮对话示例

下面展示如何进行连续的对话:

In [4]
# 多轮对话示例# 通过维护messages列表来实现多轮对话# 初始化对话历史,设置AI角色messages = [
    {        "role": "system",  # system角色用于设置AI的行为和角色
        "content": "你是一位专业的诗歌创作者"  # 设定AI的角色和行为
    }
]# 第一轮对话:请求AI创作诗歌messages.append({"role": "user", "content": "写一首关于春天的诗"})
response = client.chat.completions.create(
    model="ernie-3.5-8k",
    messages=messages  # 传入完整的对话历史)print("第一轮 - AI创作的诗:\n")print(response.choices[0].message.content)# 将AI的回复添加到对话历史中,这很重要!messages.append({"role": "assistant", "content": response.choices[0].message.content})
登录后复制
第一轮 - AI创作的诗:

春归

春风吹过草丛稀,万物复苏生机迸。
花开满园映日红,蜂蝶翩翩舞轻轻。

绿叶蔓延穿过枝,柳絮飘落似霞细。
江水潺潺流不息,山川秀美添新翠。

田间耕耘人欢畅,笑语盈盈歌飘荡。
夜来春雨润无声,晨曦微露露珠亮。

愿得此景常相伴,年年岁岁春如归。
心中欢喜无限意,共赏春光醉芳菲。
登录后复制
In [6]
# 第二轮对话:请求改写诗歌print("\n让我们请AI改写这首诗:\n")
messages.append({"role": "user", "content": "把这首诗改写成现代诗的风格"})
response = client.chat.completions.create(
    model="ernie-4.0-8k",
    messages=messages  # AI会根据完整的对话历史进行回复)print("第二轮 - AI改写的现代诗:\n")print(response.choices[0].message.content)
登录后复制
让我们请AI改写这首诗:

第二轮 - AI改写的现代诗:

春归(现代诗版)

春风轻拂过稀疏的草丛,
万物悄然复苏,生机勃发。
花园中,花儿热烈绽放,
映照着红日,显得分外艳丽。

蜂蝶舞动,轻盈而自由,
绿叶在枝头欢快地伸展。
柳絮如霞,轻盈飘落,
为大地增添了一抹细腻的春意。

田间,人们欢笑着耕耘,
笑语和歌声交织在空气中。
春雨在夜晚悄然降临,
晨曦中,晶莹的露珠闪耀。

愿这春日的景象永驻,
年年岁岁,春天如期而至。
心中满是欢喜与期待,
在这春光中,我们沉醉于花的芬芳。
登录后复制

打印思维链(DeepSeek-R1)

In [1]
#流式import osfrom openai import OpenAI


completion = client.chat.completions.create(
    model="deepseek-r1",
    messages=[
        {'role': 'system', 'content': '你是 AI Studio 实训AI开发平台的开发者助理,你精通开发相关的知识,负责给开发者提供搜索帮助建议。'},
        {'role': 'user', 'content': '你好,请介绍一下AI Studio'}
    ],
    stream=True,
)for chunk in completion:    if (len(chunk.choices) > 0):        if hasattr(chunk.choices[0].delta, 'reasoning_content') and chunk.choices[0].delta.reasoning_content:            print(chunk.choices[0].delta.reasoning_content, end="", flush=True)        else:            print(chunk.choices[0].delta.content, end="", flush=True)
登录后复制
好的,我现在要帮用户介绍AI Studio。首先,用户可能刚接触这个平台,需要了解基本信息。我应该先查证AI Studio的所属公司,确保信息准确。记得之前百度的飞桨平台有一个AI Studio,可能就是这个。然后要确定它的主要功能和用户群体,比如是否面向学生、研究人员还是企业开发者。

用户可能需要知道平台提供的资源,比如数据集、算力支持、教程等。另外,用户可能关心是否需要付费,或者有没有免费资源。需要确认是否有GPU/TPU加速,这对深度学习项目很重要。还有社区和支持,比如比赛、项目分享,这些能帮助用户学习和交流。

还要考虑用户的使用场景,比如学术研究、项目开发或者学习AI。不同的场景可能需要强调不同的功能。比如,对于学习者,教程和实验环境很重要;对于开发者,模型部署和协作<a style="color:#f60; text-decoration:underline;" title="工具" href="https://www.php.cn/zt/16887.html" target="_blank">工具</a>可能更关键。

可能需要检查是否存在混淆,比如其他公司的类似产品,如Google的AI Platform,但用户明确提到AI Studio,应聚焦在正确的产品上。最后确保语言简洁明了,结构清晰,分点列出,方便用户快速获取信息。


AI Studio 是百度推出的 **一站式AI开发平台**,主要服务于机器学习、深度学习开发者,提供从数据预处理、模型训练到部署的全流程支持。以下是核心功能的详细介绍:

---

### **1. 核心功能**
- **在线编程环境**  
  - 支持 **Jupyter Notebook**,无需配置本地环境,直接在线编写、调试代码。
  - 预装主流深度学习框架(如PaddlePaddle、PyTorch、TensorFlow),开箱即用。

- **免费算力资源**  
  - 提供 **GPU(如V100、A100)和TPU** 算力卡,适合训练大规模模型。
  - 每日登录可领取算力时长,学生和开发者可低成本实践复杂项目。

- **丰富数据集与模型库**  
  - 内置 **AI竞赛数据集**(如图像分类、NLP)、公开数据集(如COCO、ImageNet)。
  - 预训练模型库覆盖CV、NLP、语音等领域,支持快速迁移学习。

- **项目协作与部署**  
  - 支持多人协作开发,代码、数据实时共享。
  - 提供模型一键部署到云端或边缘设备的工具链(如Paddle Serving、Lite)。

---

### **2. 适用场景**
- **教育与学习**  
  - 配套 **免费课程与实战项目**(如Python入门、CV入门),适合零基础学习者。
  - 高校合作项目提供学分认证,例如《深度学习导论》实践课。

- **竞赛与社区**  
  - 定期举办AI竞赛(如中国高校计算机大赛),提供奖金与实习机会。
  - 活跃的开发者社区可分享项目、获取反馈,加速问题解决。

- **企业级开发**  
  - 支持工业级模型开发,如OCR、智能推荐系统。
  - 与百度云无缝集成,可直接部署至BML(Baidu Machine Learning)平台。

---

### **3. 使用成本**
- **免费基础版**:提供基础GPU算力(如Tesla V100 4小时/天)及存储空间。
- **付费升级**:专业版和企业版提供更高算力配额、私有数据集及专属技术支持。

---

### **4. 特色优势**
- **国产化支持**:深度适配国产芯片(如昆仑芯),助力自主可控AI生态。
- **中文友好**:文档、教程、社区支持全中文,降低语言门槛。
- **实战导向**:提供端到端项目案例(如车牌识别、对话生成),即学即用。

---

如果需要进一步了解具体功能(如如何调用预训练模型)或实战案例,可以告诉我你的需求方向(如CV/NLP),我会提供更针对性的指导! 
登录后复制

以上就是从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用!的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号