|
- import os
- import platform
- import json
- import threading
- from time import sleep
-
- import openai
- import websocket
- import ssl
-
- from SparkApi import Ws_Param, on_message, on_error, on_open, on_close, main
- from recvChatGPT_V3 import Chatbot_V3
- from flask import Flask, request, render_template, Response, abort
- from flask_cors import CORS, cross_origin
- import redis
- from rpc_test import Zhouzhou
-
- app = Flask(__name__)
-
- # openai.api_key = os.getenv("OPENAI_API_KEY")
- openai.api_key = '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'
-
- skills = {}
-
-
- class ChatCompletionCustom:
- def __init__(self):
- self.role = {"role": "system", "content": "you are a useful assistant."}
- self.history = []
- self.skill_list = {}
- self.embedding_strings = ['华大基因公司主营业务为通过基因检测、质谱检测、生物信息分析等多组学大数据技术手段,',
- '华大基因公司为科研机构、企事业单位、医疗机构、社会卫生组织等提供研究服务和精准医学检测综合解决方案。',
- '华大基因以推动生命科学研究进展、生命大数据应用和提高全球医疗健康水平为出发点,',
- '基于基因领域研究成果及精准检测技术在民生健康方面的应用,',
- '致力于加速科技创新,减少出生缺陷,加强肿瘤防控,抑制重大疾病对人类的危害,实现精准治愈感染,全面助力精准医学。',
- '以华大基因举例:作为中国基因行业的奠基者,秉承“基因科技造福人类”的愿景,通过20多年的人才积聚、科研积累和产业积淀,',
- '华大基因公司已建成覆盖全球百余个国家和全国所有省市自治区的营销服务网络,成为屈指可数的覆盖本行业全产业链、全应用领域的科技公司,立足技术先进、配置齐全和规模领先的多组学产出平台,已成为全球屈指可数的科学技术服务提供商和精准医疗服务运营商。',
- '2017年,华大基因于深圳证券交易所创业板上市',
- '在2016年的自然指数排名(Nature Index Annual Tables)中,华大名列亚太地区生命科学产业机构(life science - corporate)第一位,并连续七年蝉联该排名第一',
- '人类基因组计划:1999年9月1日,于英国茵格斯顿举行的第五次人类基因组测序战略会议上,华大基因创始人之一杨焕明提出,中国愿承担人类3号染色体短臂端粒一侧约30厘摩尔(相当于约3,000万个碱基对)区域的测序和分析任务,占整体人类基因组测序工作的1%,成为人类基因组计划成员当中唯一一个发展中国家',
- '水稻基因组计划:水稻(籼稻)基因组工作框架图:华大基因于2000年启动水稻基因组计划,希望通过测序找出水稻产量相关基因,并于2002年在《科学》期刊以封面文章发布首个水稻(籼稻))因组的工作框架序列图,文章先后被引用接近四千次。此次由中国科学家合作完成的水稻基因工作框架图,是继人类基因组之后完成测定的最大的基因组,也是当时测定的最大植物基因组。 水稻作为第一个完成基因组测序农作物,对解决全球粮食问题具有重要意义,建立了改善水稻品质、提高水稻产量的重要基础,并被当时《科学》杂志期刊编辑认为水稻基因组研究工作,对人类健康的重要性在接下来的二十年较人类基因组更大',
- '国际大熊猫基因组计划:从北京奥运会的吉祥物大熊猫“晶晶”抽取样本,利用短序列(short-reads)模式组装全球首个熊科动物、也是第二个肉食类动物的基因图谱,包含2.25千兆(Gb)个碱基对,并于2010年1月在《自然》科学期刊以封面文章发布。研究进一步支持大多数科学家所持的“大熊猫属于熊科动物”的观点,并为日后使用次世代基因测序技术,快速省时地组装大型真核生物(eukaryotic),如哺乳类动基因图谱奠定了基础。研究指出,相比于自然环境,人类活动对其造成的影响更为严重']
- # self.df = get_embed_array(self.embedding_strings)
-
-
- chat = ChatCompletionCustom()
-
- zhouzhou = Zhouzhou()
-
- # config set
- config = {
- "key": "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",
- 'proxy': None,
- 'ip': '127.0.0.1', # "127.0.0.1" or your server's internal network ip or your server's public ip
- 'port': 5001,
- }
-
- URL_API = "https://api.openai.com/v1/chat/completions"
-
- headers = {
- "Content-Type": "application/json",
- "Authorization": f"Bearer {config['key']}"
- }
-
- # init chat bot
- chatbot = Chatbot_V3(config['key'], "gpt-3.5-turbo", proxy=config['proxy'])
-
-
- # 给定一个Dictory,循环获取key,value,并将其组合成"1、{key}2、{key}3、{key}的格式"
- def format_skill_list(list={}, msg=''):
- prifix = '假设你是北京联通公司的客服,我会给你提出一个问题{q},你在我给定的以下列表{list}中出找一个与该问题{q}接近的问题,如果没有符合的答案,回复”””Null”””。列表{list}问题如下:'
- suffix = ',不要做多余回答,回复的内容只能是列表{list}中的内容或"""Null""",我接下来问的问题是:'
- result = prifix + '"""'
- for i, (key, value) in enumerate(list.items()):
- result += f"{i + 1}、{key}"
- result += '"""' + suffix + msg
- print(result)
- return result
-
-
- def format_skill_list_movie(list={}, msg=''):
- prifix = 'answer only in a mark down cell, find the closest sentence . The format is' + \
- '"""' + \
- '[{"msg": <sentence>}]' + \
- '"""' + \
- 'Returns Null if there is no matching sentence.The format is' + \
- '"""' + \
- '[{"msg":"Null"}]' + \
- '"""' + \
- '我提供的句子如下:'
- suffix = '不附加说明和解释的文字。' + \
- 'my paragraph is:'
- result = prifix + '['
- for i, (key, value) in enumerate(list.items()):
- result += "{" + f"{i + 1}、{key}" + "},"
- result = result[0: -1] + ']' + suffix + '"""' + msg + '"""'
- print(result)
- return result
-
- def format_skill_list_zhenhuan(list={}, msg='',q_arrs=[]):
- prifix = '假设你是公司前台,你在与面前的人对话,语段代表对方的问话,首先生成一个应对,然后从列表中选出一个选项作为回答的内容,如果没有对应意图或者语段缺失则返回0。列表为'
- # suffix = '。输出为JSON格式,键为number,代表应对的编号。示例输出为:{"number":_}。不要输出任何说明和解释。语段为:'
- suffix = '。输出为JSON格式,键为number,代表应对的编号。不要输出任何说明和解释。语段为:'
- result = prifix + '{'
- for i, (key, value) in enumerate(list.items()):
- q_arrs.append(key)
- result += f"{i + 1}、{key}"
- result += '}' + suffix + msg + '"'
- # result = prifix + msg + suffix
- print(result)
- return result,q_arrs
-
-
- # Routing, rendering chat interface
- @app.route('/')
- def index():
- chatbot.reset()
- return render_template('chat.html')
-
-
- # Routing, normal chat,not SSE
- @app.route('/chat', methods=['POST'])
- def chat():
- postData = request.get_json() # Get data from POST request
- print(postData)
- query = postData.get('query', 'Hello')
- max_token = postData.get('max_token', '3000') # nouse
- temperature = postData.get('temperature', 0.5)
- top_p = postData.get('top_p', 1.0)
- role = postData.get('role', 'user')
- convo_id = postData.get('convo_id', 'default')
- n = postData.get('n', 1)
- try:
- response = chatbot.ask(prompt=query, role=role, convo_id=convo_id, top_p=top_p, temperature=temperature, n=n)
- print(response)
- return response
- except Exception as e:
- return e
-
-
- # Routing, SSE chat
- @app.route('/chatstream', methods=['GET', 'POST'])
- def chat_stream():
- query = request.args.get('query', 'Hello')
- max_token = float(request.args.get('max_token', '3000')) # nNouse
- temperature = float(request.args.get('temperature', '0.5'))
- top_p = float(request.args.get('top_p', '1.0'))
- role = request.args.get('role', 'user')
- convo_id = request.args.get('convo_id', 'default')
- n = int(request.args.get('n', '1'))
- # 将问题格式化
- query = format_skill_list(chatbot.skills, query)
-
- return Response(
- chatbot.ask_stream_text(prompt=query, role=role, convo_id=convo_id, top_p=top_p, temperature=temperature, n=n),
- mimetype='text/event-stream')
-
-
- def chat_completion_for_multi_turn(msg):
- role = {"role": "system", "content": "你是一个幽默段子手."}
- print("当前角色: {}".format(chat.role['content']))
- input_message = [
- chat.role
- ]
- for i in range(len(msg)):
- # 对i除以2取余数,如果是0,输入input_message.append({"role": "user", "content": msg[i]}),否则输入input_message.append({"role": "assistant", "content": msg[i]})
- if i % 2 == 0:
- input_message.append({"role": "user", "content": msg[i]})
- else:
- input_message.append({"role": "assistant", "content": msg[i]})
- print("调用gpt的prompts:")
- print(input_message)
- completion = openai.ChatCompletion.create(
- model="gpt-3.5-turbo",
- # model="gpt-4",/
- messages=input_message,
- temperature=0.8,
- frequency_penalty=0,
- max_tokens=1024,
- presence_penalty=0,
- top_p=1
- )
- print(completion.choices[0].message['content'])
- temp_completion = {'question': {"role": "user", "content": msg},
- 'answer': {"role": "assistant", "content": completion.choices[0].message['content']}}
-
- return completion.choices[0].message['content']
-
-
- @app.route(rule='/chat_data', methods=['post'])
- @cross_origin()
- def chat_data():
- chat.role = {"role": "system",
- "content": '根据以下文章提出可能问到的10个问题,并给出对应的答案,回答的形式为"{序号}、{问题}|{答案}",不要回复其他内容。'}
- # chat.role = {"role": "system", "content": '我会给出一部电影的资料,将资料拆解成10个问题,要求每个问题的开头都是电影名,并给出对应的答案。回答的形式为"{序号}、{电影名}{问题}|{答案}",不要回复其他内容。'}
-
- try:
- req = request
- msg = []
- m = request.json.get('corpus')
- # 如果m不为空,就加入到msg中
- if m is not None:
- msg.append(m)
- data = {'msg': chat_completion_for_multi_turn(msg)}
- print("success")
- test = {}
- # 获得的结果字符串为"问题1|答案1\n问题2|答案2\n问题3|答案3\n问题4|答案4\n...",循环将其分割为问题和答案,将问题作为key,答案作为value,存储在chat.skill_list中
- for i in data['msg'].split('\n'):
- print()
- # chat.skill_list[i.split('|')[0].index('、')] = i.split('|')[1]
- q = i.split('|')[0]
- a = i.split('|')[1]
- chatbot.skills[q[q.index('、') + 1:]] = a
-
- # 将chat.skill_list中的key和value用print()函数打印出来
- for i, (key, value) in enumerate(chatbot.skills.items()):
- print(f"{i + 1}、{key}:{value}")
-
- # 获取当前路径并打印出来
- print(os.getcwd())
-
- # 将chatbot.skills中的key和value保存到skills.csv中,以便后续使用
- with open('/Users/ruoxiyin/Documents/缔智元/代码/chatGPT_Web-main/skills.csv', 'a', encoding='utf-8') as f:
- for key, value in chatbot.skills.items():
- f.write(f"{key}|{value}\n")
- return data
- except Exception as e:
- print("An exception occurred:", str(e))
- return {'msg': '真抱歉,我连接Chatgpt的好像出现问题了呀'}
-
-
- @app.route(rule='/get_skill_list', methods=['get'])
- @cross_origin()
- def get_skill_list():
- print("get_skill_list")
- # 将chat.skill_list中的key和value用print()函数打印出来
- for i, (key, value) in enumerate(chatbot.skills.items()):
- print(f"{i + 1}、{key}:{value}")
- # 将chatbot.skills序列化成json格式后作为返回值返回
- return json.dumps(chatbot.skills, ensure_ascii=False)
-
-
- @app.route(rule='/question_answer', methods=['post'])
- @cross_origin()
- def question_answer():
- # 连接redis数据库,地址为39.107.77.235,端口为6379
- r = redis.Redis(host='39.107.77.235', port=6381)
- # 获取redis数据库中的key为"session"的值,如果存在,返回0,否则新增一个key为"session"的值,值为1
- session = r.get("chatgpt:session")
- if session is None:
- r.set("session", 1)
- else:
- # 断开redis数据库的连接
- r.close()
- abort(500)
-
- chat.role = {"role": "system", "content": '你是一个有用的助理'}
- try:
- req = request
- msg = []
- m = request.json.get('corpus')
- # 如果m不为空,就加入到msg中
-
- if m is not None:
- # m = format_skill_list(chatbot.skills, m)
- m = format_skill_list_movie(chatbot.skills, m)
- msg.append(m)
- resp = chat_completion_for_multi_turn(msg)
- print(resp)
- if resp == 'Null':
- data = {'msg': "对不起,这个问题我不太清楚呀"}
- # resp = resp[resp.index('、') + 1:]
- else:
- # 判断chatbot.skills字典是否有resp的key
- if resp in chatbot.skills.keys():
- data = {'msg': chatbot.skills[resp]}
- else:
- data = "对不起,这个问题我不太清楚呀"
- # 循环遍历chatbot.skills,resp如果包含key,则将对应value赋值给data
- for key, value in chatbot.skills.items():
- if key in resp:
- data = {'msg': value}
- break
-
- # 清空redis数据库中的key为"session"的值,并断开连接
- r.delete("chatgpt:session")
- r.close()
- # zhouzhou发送text消息
- # zhouzhou.say_text(data['msg'])
- return data
- except Exception as e:
- print("An exception occurred:", str(e))
- return {'msg': '真抱歉,我连接Chatgpt的好像出现问题了呀'}
-
-
- def do_stream_response(resp_words):
- for i in range(0, len(resp_words)):
- sleep(0.1)
- yield 'data: {}\n\n'.format(json.dumps({'content': resp_words[i]}))
-
-
- @app.route('/chatstream_qa', methods=['GET', 'POST'])
- @cross_origin()
- def chat_stream_qa():
- chat.role = {"role": "system", "content": '你是一个有用的助理'}
- query = request.args.get('query', 'Hello')
- # 将问题格式化
- msg = []
- q_arrs = []
- query, q_arrs = format_skill_list_zhenhuan(chatbot.skills, query,q_arrs)
- msg.append(query)
- resp = chat_completion_for_multi_turn(msg)
- # resp = 'Null'
- data = ''
- # 将resp用json格式化,获取当中的number字段
- resp = json.loads(resp)
- resp = resp['number']
-
- if resp == 0:
- data = "对不起,这个问题我不太清楚呀"
- else:
- # 根据resp的数字获取q_arrs中对应元素,并将该元素判断chatbot.skills字典是否有对应的key
- resp = q_arrs[resp - 1]
- if resp in chatbot.skills.keys():
- data = '匹配到问题:' + resp + ',回答:' + chatbot.skills[resp]
- else:
- print('data:' + data)
- if data is None or data == '':
- data = "对不起,这个问题我不太清楚呀"
- # 循环遍历chatbot.skills,resp如果包含key,则将对应value赋值给data
- for key, value in chatbot.skills.items():
- if key in resp:
- data = value
- break
- # zhouzhou发送text消息
- # zhouzhou.say_text(data)
- return Response(do_stream_response(data), mimetype='text/event-stream')
- # return Response('data: {}\n\n'.format(json.dumps({'content':data})))
-
-
- @app.route('/chat_qa', methods=['GET', 'POST'])
- @cross_origin()
- def chat_qa():
- chat.role = {"role": "system", "content": '你是一个有用的助理'}
- print(request.args)
- query = request.args.get('query', 'Hello')
- # 将问题格式化
- msg = []
- q_arrs = []
- query, q_arrs = format_skill_list_zhenhuan(chatbot.skills, query,q_arrs)
- msg.append(query)
- resp = chat_completion_for_multi_turn(msg)
- # resp = 'Null'
- data = ''
- # 将resp用json格式化,获取当中的number字段
- resp = json.loads(resp)
- resp = resp['number']
-
- if resp == 0:
- data = "对不起,这个问题我不太清楚呀"
- else:
- # 根据resp的数字获取q_arrs中对应元素,并将该元素判断chatbot.skills字典是否有对应的key
- resp = q_arrs[resp - 1]
- if resp in chatbot.skills.keys():
- data = chatbot.skills[resp]
- else:
- print('data:' + data)
- if data is None or data == '':
- data = "对不起,这个问题我不太清楚呀"
- # 循环遍历chatbot.skills,resp如果包含key,则将对应value赋值给data
- for key, value in chatbot.skills.items():
- if key in resp:
- data = value
- break
- # zhouzhou发送text消息
- # zhouzhou.say_text(data)
- # 将data格式化成json格式,存入msg字段中
- data = {'msg': data}
- return data
-
-
- @app.route('/chatstream_fire', methods=['GET', 'POST'])
- @cross_origin()
- def chat_stream_fire():
- chat.role = {"role": "system", "content": '你是一个有用的助理'}
- query = request.args.get('query', 'Hello')
-
- # 将问题格式化
- msg = []
- q_arrs = []
- query, q_arrs = format_skill_list_zhenhuan(chatbot.skills, query,q_arrs)
- msg.append(query)
- # 获取一个condition,并将condition存入Ws_Param中
- condition = threading.Condition()
- # condition.acquire()
- print(query)
- resp = main(appid="3d9282da",
- api_secret="ZTRiNDQwMTRlOTlmZDQwMDUwYTdjMDM0",
- api_key="7c217b3a313f4b66fcc14a8e97f85103",
- gpt_url="ws://spark-api.xf-yun.com/v1.1/chat",
- # question='你是谁')
- # question='将给定语段转换为含义最相似的意图 。意图是如下列表中的一项。如果没有对应意图或者语段缺失则返回0.列表为{1、你喜欢的状态是什么。2、公司高管有谁。3、打印机怎么使用。4、员工的福利有哪些。5、公司的价值观是什么。6、工作时间是几点。7、公司的愿景是什么。8、公司的使命是什么。9、公司有哪些产品。10、员工守则是什么。11、介绍一下你们公司。12、洗手间怎么走。13、开门。14、关门。15、取消你的静音。16、调小你的音量。17、调大你的音量。18、把你的声音关掉。19、介绍你自己。20、介绍我。21、预约个访客。22、预约会议。23、大会议室的地点。24.小会议室的地点。25、打招呼。26.停止。27、找人。28、在不在。}。输出为JSON格式,键为number。不要输出任何说明和解释。语段为“[用户]:'
- question=query)
-
- # condition.wait()
- # condition.release()
- # resp = chat_completion_for_multi_turn(msg)
- # resp = 'Null'
- data = ''
- # 将resp用json格式化,获取当中的number字段
- resp = json.loads(resp)
- resp = resp['number']
- if resp == 'Null':
- data = "对不起,这个问题我不太清楚呀"
- else:
- # 根据resp的数字获取q_arrs中对应元素,并将该元素判断chatbot.skills字典是否有对应的key
- resp = q_arrs[resp - 1]
- if resp in chatbot.skills.keys():
- data = chatbot.skills[resp]
- else:
- print('data:' + data)
- if data is None or data == '':
- data = "对不起,这个问题我不太清楚呀"
- # 循环遍历chatbot.skills,resp如果包含key,则将对应value赋值给data
- for key, value in chatbot.skills.items():
- if key in resp:
- data = value
- break
-
- # return Response(do_stream_response(data), mimetype='text/event-stream')
- # return Response('data: {}\n\n'.format(json.dumps({'content':data})))
- data = {'msg': data}
- return data
-
-
- if __name__ == '__main__':
- app.run(debug=True, host=config['ip'], port=config['port'])
|