Sfoglia il codice sorgente

first commit

pull/1/head
10710 1 anno fa
commit
c884869a7e
22 ha cambiato i file con 1650 aggiunte e 0 eliminazioni
  1. +160
    -0
      .gitignore
  2. +106
    -0
      cnnasd.py
  3. +119
    -0
      convkbasd.py
  4. +391
    -0
      data/data.csv
  5. +91
    -0
      data/test.csv
  6. +301
    -0
      data/train.csv
  7. +56
    -0
      dataget.py
  8. +97
    -0
      double_towerasd.py
  9. +0
    -0
      embeddings/__init__.py
  10. +22
    -0
      embeddings/dashscopeembedding.py
  11. +12
    -0
      embeddings/embedding.py
  12. +27
    -0
      embeddings/liandongembedding.py
  13. +16
    -0
      embeddings/zhipuembedding.py
  14. +85
    -0
      main.py
  15. +2
    -0
      models/__init__.py
  16. BIN
      models/cnn.pth
  17. +39
    -0
      models/cnn.py
  18. BIN
      models/convkb.pth
  19. +31
    -0
      models/convkb.py
  20. BIN
      models/doubletower.pth
  21. +62
    -0
      models/doubletower.py
  22. +33
    -0
      settings.ini

+ 160
- 0
.gitignore Vedi File

@@ -0,0 +1,160 @@
# Byte-compiled / optimized / DLL files
__pycache__/
*.py[cod]
*$py.class

# C extensions
*.so

# Distribution / packaging
.Python
build/
develop-eggs/
dist/
downloads/
eggs/
.eggs/
lib/
lib64/
parts/
sdist/
var/
wheels/
share/python-wheels/
*.egg-info/
.installed.cfg
*.egg
MANIFEST

# PyInstaller
# Usually these files are written by a python script from a template
# before PyInstaller builds the exe, so as to inject date/other infos into it.
*.manifest
*.spec

# Installer logs
pip-log.txt
pip-delete-this-directory.txt

# Unit test / coverage reports
htmlcov/
.tox/
.nox/
.coverage
.coverage.*
.cache
nosetests.xml
coverage.xml
*.cover
*.py,cover
.hypothesis/
.pytest_cache/
cover/

# Translations
*.mo
*.pot

# Django stuff:
*.log
local_settings.py
db.sqlite3
db.sqlite3-journal

# Flask stuff:
instance/
.webassets-cache

# Scrapy stuff:
.scrapy

# Sphinx documentation
docs/_build/

# PyBuilder
.pybuilder/
target/

# Jupyter Notebook
.ipynb_checkpoints

# IPython
profile_default/
ipython_config.py

# pyenv
# For a library or package, you might want to ignore these files since the code is
# intended to run in multiple environments; otherwise, check them in:
# .python-version

# pipenv
# According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
# However, in case of collaboration, if having platform-specific dependencies or dependencies
# having no cross-platform support, pipenv may install dependencies that don't work, or not
# install all needed dependencies.
#Pipfile.lock

# poetry
# Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
# This is especially recommended for binary packages to ensure reproducibility, and is more
# commonly ignored for libraries.
# https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
#poetry.lock

# pdm
# Similar to Pipfile.lock, it is generally recommended to include pdm.lock in version control.
#pdm.lock
# pdm stores project-wide configurations in .pdm.toml, but it is recommended to not include it
# in version control.
# https://pdm.fming.dev/#use-with-ide
.pdm.toml

# PEP 582; used by e.g. github.com/David-OConnor/pyflow and github.com/pdm-project/pdm
__pypackages__/

# Celery stuff
celerybeat-schedule
celerybeat.pid

# SageMath parsed files
*.sage.py

# Environments
.env
.venv
env/
venv/
ENV/
env.bak/
venv.bak/

# Spyder project settings
.spyderproject
.spyproject

# Rope project settings
.ropeproject

# mkdocs documentation
/site

# mypy
.mypy_cache/
.dmypy.json
dmypy.json

# Pyre type checker
.pyre/

# pytype static type analyzer
.pytype/

# Cython debug symbols
cython_debug/

# PyCharm
# JetBrains specific template is maintained in a separate JetBrains.gitignore that can
# be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
# and can be added to the global gitignore or merged into this file. For a more nuclear
# option (not recommended) you can uncomment the following to ignore the entire idea folder.
#.idea/

+ 106
- 0
cnnasd.py Vedi File

@@ -0,0 +1,106 @@
import torch
import dashscope
from http import HTTPStatus
from dashscope import TextEmbedding
from torch import nn
import torch.optim as optim
import pandas as pd
import numpy as np
import models
dashscope.api_key = 'sk-44ccc9ab5e754eddb545cade12b632cf'
cache = {}
answerCache = []


def getem(question):
global cache
if question in cache.keys():
return cache[question]
resp = TextEmbedding.call(model=TextEmbedding.Models.text_embedding_v1,
input=question,
text_type='query')
if resp.status_code == HTTPStatus.OK:
cache[question] = resp['output']['embeddings'][0]['embedding']
return resp['output']['embeddings'][0]['embedding']


model = models.cnn.CNN()


criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

train = []
test = []
dataall = pd.read_csv('data/data.csv')
dataall = dataall.iloc[:, 1:4]

dataall = dataall.sample(frac=1)
train = dataall.iloc[0:300]
train = train.reset_index(drop=True)
test = dataall.iloc[300:]
test = test.reset_index(drop=True)
nlossLast = 0
for i in range(1):
nloss = 0
for k in range(len(train)):
va = getem(train.iloc[k]['question'])
vb = getem(train.iloc[k]['answer'])
if train.iloc[k]['answer'] not in answerCache:
answerCache.append(train.iloc[k]['answer'])
trainTensor = torch.Tensor([va, vb]).reshape([1, 1, len(va) + len(vb)])
output = model(trainTensor)
# 计算损失
if train.iloc[k]['label'] == 1:
loss = criterion(output,
torch.tensor([1, 0]).float().reshape([1, 2]))
else:
loss = criterion(output,
torch.tensor([0, 1]).float().reshape([1, 2]))
# 反向传播并更新权重
optimizer.zero_grad()
loss.backward()
optimizer.step()
nloss += loss
if k % 50 == 0:
print(i, k, 'done')
if abs(nloss - nlossLast) < 0.0001:
continue
else:
nlossLast = nloss
print('one loop done', nloss/len(train))


p = 0
for i in range(len(test)):
va = getem(test.iloc[i]['question'])
Scores = np.zeros(len(answerCache))
for j in range(len(answerCache)):
vb = getem(answerCache[j])
testTensor = torch.Tensor([va, vb]).reshape([1, 1, 3072])
output = model(testTensor)
Scores[j] = output[0][0]
for k in range(2):
if test.iloc[i]['label'] == 1:
vc = test.iloc[i]['answer']
else:
vc = ''
tt = Scores.argmax()
if Scores[tt] > 0.5:
vb = answerCache[tt]
Scores[tt] = -1
else:
vb = ''
if vb == vc:
p += 1
break
print(p/len(test))


def main(**param):
print('this message is from main function')


if __name__ == '__main__':
main()
print('now __name__ is %s' % __name__)

+ 119
- 0
convkbasd.py Vedi File

@@ -0,0 +1,119 @@
import torch
import dashscope
from http import HTTPStatus
from dashscope import TextEmbedding
from torch import nn
import torch.optim as optim
import pandas as pd
import numpy as np
dashscope.api_key = 'sk-44ccc9ab5e754eddb545cade12b632cf'
cache = {}
answerCache = []


def getem(question):
global cache
if question in cache.keys():
return cache[question]
resp = TextEmbedding.call(model=TextEmbedding.Models.text_embedding_v1,
input=question,
text_type='query')
if resp.status_code == HTTPStatus.OK:
cache[question] = resp['output']['embeddings'][0]['embedding']
return resp['output']['embeddings'][0]['embedding']


class ConvNet(nn.Module):
def __init__(self):
super(ConvNet, self).__init__()
self.conv1 = nn.Conv1d(2, 1, kernel_size=1, stride=1, padding=0)
self.relu1 = nn.ReLU()
self.conv2 = nn.Conv1d(2, 1, kernel_size=1, stride=1, padding=0)
self.relu2 = nn.ReLU()
self.conv3 = nn.Conv1d(2, 1, kernel_size=1, stride=1, padding=0)
self.relu3 = nn.ReLU()
self.fc = nn.Linear(1536 * 3, 2)
self.sigmoid = nn.Sigmoid()

def forward(self, x):
X1 = self.conv1(x)
X1 = self.relu1(X1)
X2 = self.conv2(x)
X2 = self.relu1(X2)
X3 = self.conv3(x)
X3 = self.relu1(X3)
X = torch.cat([X1, X2, X3], dim=2)
X = X.view(-1, 1536 * 3)
X = self.fc(X)
X = self.sigmoid(X)
return X


# 创建模型实例
model = ConvNet()

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

train = []
test = []
dataall = pd.read_csv('data.csv')
dataall = dataall.iloc[:, 1:4]

dataall = dataall.sample(frac=1)
train = dataall.iloc[0:300]
train = train.reset_index(drop=True)
test = dataall.iloc[300:]
test = test.reset_index(drop=True)
nlossLast = 0
for i in range(5):
nloss = 0
for k in range(len(train)):
va = getem(train.iloc[k]['question'])
vb = getem(train.iloc[k]['answer'])
if train.iloc[k]['answer'] not in answerCache:
answerCache.append(train.iloc[k]['answer'])
trainTensor = torch.Tensor([va, vb]).reshape([1, 2, len(va)])
output = model(trainTensor)
# 计算损失
if train.iloc[k]['label'] == 1:
loss = criterion(output,
torch.tensor([1, 0]).float().reshape([1, 2]))
else:
loss = criterion(output,
torch.tensor([0, 1]).float().reshape([1, 2]))
# 反向传播并更新权重
optimizer.zero_grad()
loss.backward()
optimizer.step()
nloss += loss
if k % 50 == 0:
print(i, k, 'done')
print('one loop done', nloss/len(train))


p = 0
for i in range(len(test)):
va = getem(test.iloc[i]['question'])
Scores = np.zeros(len(answerCache))
for j in range(len(answerCache)):
vb = getem(answerCache[j])
testTensor = torch.Tensor([va, vb]).reshape([1, 2, len(va)])
output = model(testTensor)
Scores[j] = output[0][0]
for k in range(2):
if test.iloc[i]['label'] == 1:
vc = test.iloc[i]['answer']
else:
vc = ''
tt = Scores.argmax()
if Scores[tt] > 0.5:
vb = answerCache[tt]
Scores[tt] = -1
else:
vb = ''
if vb == vc:
p += 1
break
print(p/len(test))

+ 391
- 0
data/data.csv Vedi File

@@ -0,0 +1,391 @@
,question,answer,label
0,东升杯举办过多少次,中关村东升科技园举办了多少次东升杯创业大赛?,1
1,东升杯举办过多少次,中关村东升科技园与哪些科研机构有合作?,0
2,东升杯举办过多少次,未来,中关村东升科技园将如何推动科创发展?,0
3,东升杯举办过多少次,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
4,有过多少次东升杯,中关村东升科技园举办了多少次东升杯创业大赛?,1
5,有过多少次东升杯,未来,中关村东升科技园将如何推动科创发展?,0
6,有过多少次东升杯,中关村东升科技园与哪些科研机构有合作?,0
7,有过多少次东升杯,园区拥有多少个孵化器?,0
8,东升杯创业大赛已经举办了多少届了?,中关村东升科技园举办了多少次东升杯创业大赛?,1
9,东升杯创业大赛已经举办了多少届了?,园区孵化了多少家企业?,0
10,东升杯创业大赛已经举办了多少届了?,未来,中关村东升科技园将如何推动科创发展?,0
11,东升杯创业大赛已经举办了多少届了?,中关村东升科技园承接了哪些战略性新兴产业?,0
12,科技园有哪些合作机构,中关村东升科技园与哪些科研机构有合作?,1
13,科技园有哪些合作机构,园区有哪些优势?,0
14,科技园有哪些合作机构,缔智元科技的产品综合了哪些前沿技术?,0
15,科技园有哪些合作机构,团队合作的重要性是什么?,0
16,科技园有哪些合作对象,中关村东升科技园与哪些科研机构有合作?,1
17,科技园有哪些合作对象,中关村东升科技园承接了哪些战略性新兴产业?,0
18,科技园有哪些合作对象,园区有多少家高精尖企业?,0
19,科技园有哪些合作对象,园区有哪些优势?,0
20,东升跟那些机构有过合作,中关村东升科技园与哪些科研机构有合作?,1
21,东升跟那些机构有过合作,中关村东升科技园举办了多少次东升杯创业大赛?,0
22,东升跟那些机构有过合作,未来,中关村东升科技园将如何推动科创发展?,0
23,东升跟那些机构有过合作,中关村东升科技园承接了哪些战略性新兴产业?,0
24,1哪些科研机构是你们的合作伙伴?,中关村东升科技园与哪些科研机构有合作?,1
25,1哪些科研机构是你们的合作伙伴?,园区有多少家高精尖企业?,0
26,1哪些科研机构是你们的合作伙伴?,缔智元科技的产品综合了哪些前沿技术?,0
27,1哪些科研机构是你们的合作伙伴?,公司组织结构是如何设计的?,0
28,你们都跟谁有过合作,公司如何实现客户价值最大化?,0
29,你们都跟谁有过合作,中关村东升科技园与哪些科研机构有合作?,1
30,你们都跟谁有过合作,智慧楼宇平台的主要目标用户是谁?,0
31,你们都跟谁有过合作,团队合作的重要性是什么?,0
32,你们有哪些合作对象,团队合作的重要性是什么?,0
33,你们有哪些合作对象,公司的主要产品,0
34,你们有哪些合作对象,介绍一下联想集团,0
35,你们有哪些合作对象,公司如何实现客户价值最大化?,0
36,介绍一下你们的合作对象,介绍一下联想集团,0
37,介绍一下你们的合作对象,企业介绍是什么?,0
38,介绍一下你们的合作对象,中关村东升科技园与哪些科研机构有合作?,1
39,介绍一下你们的合作对象,团队合作的重要性是什么?,0
40,你们有什么愿景,公司愿景是什么?,0
41,你们有什么愿景,公司使命是什么?,0
42,你们有什么愿景,企业如何实现长远发展?,0
43,你们有什么愿景,公司如何实现客户价值最大化?,0
44,你们的愿景是什么,公司愿景是什么?,0
45,你们的愿景是什么,泰克威的使命是什么?,0
46,你们的愿景是什么,企业如何实现长远发展?,0
47,你们的愿景是什么,公司如何实现客户价值最大化?,0
48,介绍一下你们的愿景,公司愿景是什么?,0
49,介绍一下你们的愿景,公司使命是什么?,0
50,介绍一下你们的愿景,企业如何实现长远发展?,0
51,介绍一下你们的愿景,公司如何实现客户价值最大化?,0
52,讲一下你们的愿景,企业如何实现长远发展?,0
53,讲一下你们的愿景,公司如何实现客户价值最大化?,0
54,讲一下你们的愿景,公司愿景是什么?,0
55,讲一下你们的愿景,公司使命是什么?,0
56,你们公司愿景是什么,公司愿景是什么?,0
57,你们公司愿景是什么,公司使命是什么?,0
58,你们公司愿景是什么,公司如何实现客户价值最大化?,0
59,你们公司愿景是什么,泰克威是什么类型的公司?,0
60,你们愿景是啥,公司愿景是什么?,0
61,你们愿景是啥,公司使命是什么?,0
62,你们愿景是啥,公司如何实现客户价值最大化?,0
63,你们愿景是啥,企业如何实现长远发展?,0
64,总服务台在哪里,总服务台位置,1
65,总服务台在哪里,总服务台怎么走,1
66,总服务台在哪里,技术咨询与培训包括哪些服务?,0
67,总服务台在哪里,销售部的主要职责是什么?,0
68,怎么去总服务台,总服务台怎么走,1
69,怎么去总服务台,总服务台位置,1
70,怎么去总服务台,忘记密码后如何操作?,0
71,怎么去总服务台,技术咨询与培训包括哪些服务?,0
72,我该怎么去总服务台,总服务台怎么走,1
73,我该怎么去总服务台,总服务台位置,1
74,我该怎么去总服务台,忘记密码后如何操作?,0
75,我该怎么去总服务台,技术咨询与培训包括哪些服务?,0
76,请问服务台在哪,总服务台位置,1
77,请问服务台在哪,总服务台怎么走,1
78,请问服务台在哪,智慧楼宇平台的物业管理模块包含哪些功能?,0
79,请问服务台在哪,园区服务覆盖了多少人群?,0
80,园区有多少企业,园区孵化了多少家企业?,1
81,园区有多少企业,园区有多少家高精尖企业?,1
82,园区有多少企业,园区拥有多少个孵化器?,0
83,园区有多少企业,园区服务覆盖了多少人群?,0
84,园区里有多少企业,园区孵化了多少家企业?,1
85,园区里有多少企业,园区有多少家高精尖企业?,1
86,园区里有多少企业,园区拥有多少个孵化器?,0
87,园区里有多少企业,园区服务覆盖了多少人群?,0
88,园区入住了多少家公司,园区孵化了多少家企业?,1
89,园区入住了多少家公司,园区拥有多少个孵化器?,0
90,园区入住了多少家公司,园区有多少家高精尖企业?,1
91,园区入住了多少家公司,园区服务覆盖了多少人群?,0
92, 你们有多少公司入驻,园区孵化了多少家企业?,1
93, 你们有多少公司入驻,园区有多少家高精尖企业?,1
94, 你们有多少公司入驻,园区拥有多少个孵化器?,0
95, 你们有多少公司入驻,注册资本是多少?,0
96,介绍一下园区企业情况,园区孵化了多少家企业?,1
97,介绍一下园区企业情况,园区有多少家高精尖企业?,1
98,介绍一下园区企业情况,园区服务覆盖了多少人群?,0
99,介绍一下园区企业情况,什么是商务楼宇/园区专区?,0
100,你们孵化了多少家企业,园区孵化了多少家企业?,1
101,你们孵化了多少家企业,园区拥有多少个孵化器?,0
102,你们孵化了多少家企业,公司的发展历程是怎样的?,0
103,你们孵化了多少家企业,企业文化对企业的重要性有哪些?,0
104,介绍一下你们的产品,缔智元科技的产品综合了哪些前沿技术?,1
105,介绍一下你们的产品,云智眼是什么类型的产品?,0
106,介绍一下你们的产品,介绍一下联想集团,0
107,介绍一下你们的产品,联通提供了哪些网络类产品?,0
108,你们的产品用了哪些技术,缔智元科技的产品综合了哪些前沿技术?,1
109,你们的产品用了哪些技术,公司的主要产品,0
110,你们的产品用了哪些技术,公司如何实现客户价值最大化?,0
111,你们的产品用了哪些技术,缔智元科技提供哪些数字员工产品?,0
112,你们的产品有哪些亮点,缔智元科技的产品综合了哪些前沿技术?,0
113,你们的产品有哪些亮点,云智眼是什么类型的产品?,0
114,你们的产品有哪些亮点,联通提供了哪些网络类产品?,0
115,你们的产品有哪些亮点,消安防管理套件包括哪些产品?,0
116,你们产品优势在哪里,企业通过数字员工能带来哪些优势?,0
117,你们产品优势在哪里,缔智元科技的产品综合了哪些前沿技术?,1
118,你们产品优势在哪里,泰克威团队的特点是什么?,0
119,你们产品优势在哪里,缔智元科技提供哪些数字员工产品?,0
120,你们有什么优势,企业通过数字员工能带来哪些优势?,0
121,你们有什么优势,泰克威团队的特点是什么?,0
122,你们有什么优势,团队合作的重要性是什么?,0
123,你们有什么优势,公司如何实现客户价值最大化?,0
124,你们的优势在哪里,园区有哪些优势?,1
125,你们的优势在哪里,企业通过数字员工能带来哪些优势?,0
126,你们的优势在哪里,泰克威团队的特点是什么?,0
127,你们的优势在哪里,团队合作的重要性是什么?,0
128,说下你们的优势,园区有哪些优势?,1
129,说下你们的优势,泰克威团队的特点是什么?,0
130,说下你们的优势,企业通过数字员工能带来哪些优势?,0
131,说下你们的优势,团队合作的重要性是什么?,0
132,介绍下你们的优势,企业通过数字员工能带来哪些优势?,0
133,介绍下你们的优势,云计算与大数据的主要区别是什么?,0
134,介绍下你们的优势,介绍一下联想集团,0
135,介绍下你们的优势,企业介绍是什么?,0
136,讲讲你们的优点在哪里,团队合作的重要性是什么?,0
137,讲讲你们的优点在哪里,泰克威团队的特点是什么?,0
138,讲讲你们的优点在哪里,园区有哪些优势?,1
139,讲讲你们的优点在哪里,敬业精神的具体表现是什么?,0
140,你们有什么长处,团队合作的重要性是什么?,0
141,你们有什么长处,园区有哪些优势?,1
142,你们有什么长处,泰克威团队的特点是什么?,0
143,你们有什么长处,企业通过数字员工能带来哪些优势?,0
144,你们有什么产品,缔智元科技的产品综合了哪些前沿技术?,0
145,你们有什么产品,联通提供了哪些网络类产品?,0
146,你们有什么产品,云智眼是什么类型的产品?,0
147,你们有什么产品,缔智元科技提供哪些数字员工产品?,1
148,你们的产品有哪些亮点,公司的主要产品,1
149,你们的产品有哪些亮点,园区有哪些优势?,0
150,你们的产品有哪些亮点,缔智元科技提供哪些数字员工产品?,1
151,介绍下你们的产品,公司的主要产品,1
152,介绍下你们的产品,常见问题解答是什么?,0
153,介绍下你们的产品,缔智元科技的产品综合了哪些前沿技术?,0
154,介绍下你们的产品,企业介绍是什么?,0
155,讲一讲你们的产品,缔智元科技的产品综合了哪些前沿技术?,0
156,讲一讲你们的产品,缔智元科技提供哪些数字员工产品?,1
157,讲一讲你们的产品,介绍一下联想集团,0
158,讲一讲你们的产品,企业介绍是什么?,0
159,说说你们的产品,介绍一下联想集团,0
160,说说你们的产品,缔智元科技的产品综合了哪些前沿技术?,0
161,说说你们的产品,缔智元科技提供哪些数字员工产品?,1
162,说说你们的产品,常见问题解答是什么?,0
163,你们能提供哪些产品,联通提供了哪些网络类产品?,0
164,你们能提供哪些产品,缔智元科技提供哪些数字员工产品?,1
165,你们能提供哪些产品,缔智元科技的产品综合了哪些前沿技术?,0
166,你们能提供哪些产品,消安防管理套件包括哪些产品?,0
167,你们的服务是面向谁,园区服务覆盖了多少人群?,1
168,你们的服务是面向谁,智慧楼宇平台的主要目标用户是谁?,0
169,你们的服务是面向谁,总服务台位置,0
170,你们的服务是面向谁,商务楼宇/园区专区是面向哪些对象的?,0
171,你们服务覆盖了些什么,园区服务覆盖了多少人群?,1
172,你们服务覆盖了些什么,联通提供了哪些网络类产品?,0
173,你们服务覆盖了些什么,技术咨询与培训包括哪些服务?,0
174,你们服务覆盖了些什么,总服务台位置,0
175,你们如何推动科创发展,未来,中关村东升科技园将如何推动科创发展?,1
176,你们如何推动科创发展,中关村东升科技园承接了哪些战略性新兴产业?,0
177,你们如何推动科创发展,公司如何确保员工的持续学习和发展?,0
178,你们如何推动科创发展,如何建立和发展企业文化?,0
179,你们会怎么推动发展,企业如何实现长远发展?,0
180,你们会怎么推动发展,公司如何确保员工的持续学习和发展?,0
181,你们会怎么推动发展,如何建立和发展企业文化?,0
182,你们会怎么推动发展,未来,中关村东升科技园将如何推动科创发展?,1
183,你们会怎么继续发展,企业如何实现长远发展?,0
184,你们会怎么继续发展,公司的发展历程是怎样的?,0
185,你们会怎么继续发展,公司如何确保员工的持续学习和发展?,0
186,你们会怎么继续发展,创新是如何推动企业发展的?,0
187,你们有多少孵化器,园区拥有多少个孵化器?,1
188,你们有多少孵化器,园区孵化了多少家企业?,0
189,你们有多少孵化器,园区有多少家高精尖企业?,0
190,你们有多少孵化器,中关村东升科技园举办了多少次东升杯创业大赛?,0
191,办事大厅在哪里,北京市人民政府的主要职责是什么?,0
192,办事大厅在哪里,园区服务覆盖了多少人群?,0
193,办事大厅在哪里,北京市人民政府机关搬迁的时间和地点是什么?,0
194,办事大厅在哪里,行政部主要负责哪些工作?,0
195,怎么去办事大厅,总服务台怎么走,0
196,怎么去办事大厅,忘记密码后如何操作?,0
197,怎么去办事大厅,公司的发展历程是怎样的?,0
198,怎么去办事大厅,云计算与大数据的主要区别是什么?,0
199,我该怎么到办事大厅,总服务台怎么走,0
200,我该怎么到办事大厅,忘记密码后如何操作?,0
201,我该怎么到办事大厅,公司的发展历程是怎样的?,0
202,我该怎么到办事大厅,云计算与大数据的主要区别是什么?,0
203,请问办事大厅在哪,行政部主要负责哪些工作?,0
204,请问办事大厅在哪,北京市人民政府的主要职责是什么?,0
205,请问办事大厅在哪,常见问题解答是什么?,0
206,请问办事大厅在哪,北京市人民政府机关搬迁的时间和地点是什么?,0
207,我要去办事大厅,北京市人民政府机关搬迁的时间和地点是什么?,0
208,我要去办事大厅,行政部主要负责哪些工作?,0
209,我要去办事大厅,总服务台怎么走,0
210,我要去办事大厅,公司如何实现客户价值最大化?,0
211,我怎么能够到达办事大厅,总服务台怎么走,0
212,我怎么能够到达办事大厅,忘记密码后如何操作?,0
213,我怎么能够到达办事大厅,公司的发展历程是怎样的?,0
214,我怎么能够到达办事大厅,中关村东升科技园举办了多少次东升杯创业大赛?,0
215,你们园区承接了哪些产业,中关村东升科技园承接了哪些战略性新兴产业?,1
216,你们园区承接了哪些产业,园区服务覆盖了多少人群?,0
217,你们园区承接了哪些产业,园区有多少家高精尖企业?,0
218,你们园区承接了哪些产业,园区孵化了多少家企业?,0
219,你们园区有哪些产业,园区有哪些优势?,0
220,你们园区有哪些产业,园区有多少家高精尖企业?,0
221,你们园区有哪些产业,园区服务覆盖了多少人群?,0
222,你们园区有哪些产业,园区孵化了多少家企业?,0
223,园区里的产业有哪些,园区孵化了多少家企业?,0
224,园区里的产业有哪些,园区有多少家高精尖企业?,0
225,园区里的产业有哪些,园区服务覆盖了多少人群?,0
226,园区里的产业有哪些,中关村东升科技园承接了哪些战略性新兴产业?,1
227,那你们的价值观呢,诚信经营的核心价值观是什么?,0
228,那你们的价值观呢,企业文化与价值观的定义是什么?,0
229,那你们的价值观呢,公司如何实现客户价值最大化?,0
230,那你们的价值观呢,公司如何确保多元文化的尊重?,0
231,你的价值观是是什么,诚信经营的核心价值观是什么?,0
232,你的价值观是是什么,如何建立和发展企业文化?,0
233,你的价值观是是什么,公司使命是什么?,0
234,你的价值观是是什么,企业文化与价值观的定义是什么?,0
235,你们公司的工作时间是什么,公司使命是什么?,0
236,你们公司的工作时间是什么,公司愿景是什么?,0
237,你们公司的工作时间是什么,公司如何确保员工的持续学习和发展?,0
238,你们公司的工作时间是什么,公司组织结构是如何设计的?,0
239,你们公司的工作时间是几点,公司如何确保员工的持续学习和发展?,0
240,你们公司的工作时间是几点,公司如何确保多元文化的尊重?,0
241,你们公司的工作时间是几点,人力资源部的主要职责是什么?,0
242,你们公司的工作时间是几点,行政部主要负责哪些工作?,0
243,你们们的工作时间是什么,人力资源部的主要职责是什么?,0
244,你们们的工作时间是什么,行政部主要负责哪些工作?,0
245,你们们的工作时间是什么,敬业精神的具体表现是什么?,0
246,你们们的工作时间是什么,财务部的主要职责是什么?,0
247,你们的工作时间是几点,北京市人民政府机关搬迁的时间和地点是什么?,0
248,你们的工作时间是几点,成立时间是什么时候?,0
249,你们的工作时间是几点,行政部主要负责哪些工作?,0
250,你们的工作时间是几点,团队合作的重要性是什么?,0
251,你们的使命是什么,公司使命是什么?,0
252,你们的使命是什么,泰克威的使命是什么?,0
253,你们的使命是什么,公司愿景是什么?,0
254,你们的使命是什么,团队合作的重要性是什么?,0
255,你们想要达到的目的是什么,公司如何实现客户价值最大化?,0
256,你们想要达到的目的是什么,网络与信息安全的主要目标是什么?,0
257,你们想要达到的目的是什么,公司使命是什么?,0
258,你们想要达到的目的是什么,公司愿景是什么?,0
259,你们有什么规定啊,北京市人民政府实行什么样的管理制度?,0
260,你们有什么规定啊,常见问题解答是什么?,0
261,你们有什么规定啊,二、主要业务范围是什么?,0
262,你们有什么规定啊,公司如何确保多元文化的尊重?,0
263,你们公司有什么规定,公司如何确保多元文化的尊重?,0
264,你们公司有什么规定,公司如何确保员工的持续学习和发展?,0
265,你们公司有什么规定,北京市人民政府实行什么样的管理制度?,0
266,你们公司有什么规定,公司愿景是什么?,0
267,你们想要达到的目的是什么,企业如何实现长远发展?,0
268,你们想要达到的目的是什么,智慧楼宇平台的主要目标用户是谁?,0
269,你们想要达到的目的是什么,商务楼宇/园区专区的目标是什么?,0
270,你们有什么优势,园区有哪些优势?,1
271,我想去一下卫生间,卫生间怎么走,总服务台怎么走,0
272,我想去一下卫生间,卫生间怎么走,忘记密码后如何操作?,0
273,我想去一下卫生间,卫生间怎么走,常见问题解答是什么?,0
274,我想去一下卫生间,卫生间怎么走,总服务台位置,0
275,介绍一下你们公司,介绍一下联想集团,0
276,介绍一下你们公司,公司使命是什么?,0
277,介绍一下你们公司,企业介绍是什么?,0
278,介绍一下你们公司,公司的主要产品,0
279,介绍一下你自己,公司的发展历程是怎样的?,0
280,介绍一下你自己,团队合作的重要性是什么?,0
281,介绍一下你自己,介绍一下联想集团,0
282,介绍一下你自己,企业介绍是什么?,0
283,介绍一下你个人的优势,园区有哪些优势?,0
284,介绍一下你个人的优势,团队合作的重要性是什么?,0
285,介绍一下你个人的优势,泰克威团队的特点是什么?,0
286,介绍一下你个人的优势,企业通过数字员工能带来哪些优势?,0
287,帮我约一个明天下午的会议,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
288,帮我约一个明天下午的会议,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
289,帮我约一个明天下午的会议,北京市人民政府机关搬迁的时间和地点是什么?,0
290,帮我约一个明天下午的会议,北京市人民政府与北京市人民代表大会的关系是什么?,0
291,帮我预约个会议,1949年9月27日,中国人民政治协商会议第一届全体会议决定将北平更名为北京市的原因是什么?,0
292,帮我预约个会议,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
293,帮我预约个会议,云智眼如何实现事前预警和事中可控?,0
294,帮我预约个会议,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
295,帮我约个会议,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
296,帮我约个会议,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
297,帮我约个会议,园区拥有多少个孵化器?,0
298,帮我约个会议,董事会的主要职责是什么?,0
299,帮我做个登记,忘记密码后如何操作?,0
300,帮我做个登记,泰克威位于哪个地区?,0
301,帮我做个登记,园区拥有多少个孵化器?,0
302,明天有个客人要来,帮我做个登记,园区拥有多少个孵化器?,0
303,明天有个客人要来,帮我做个登记,泰克威位于哪个地区?,0
304,明天有个客人要来,帮我做个登记,忘记密码后如何操作?,0
305,明天有个客人要来,帮我做个登记,云智眼的主要功能有哪些?,0
306,客人登记,总服务台位置,0
307,客人登记,总服务台怎么走,0
308,客人登记,注册资本是多少?,0
309,客人登记,忘记密码后如何操作?,0
310,明天有个访客过来,我要接待,园区拥有多少个孵化器?,0
311,明天有个访客过来,我要接待,企业通过数字员工能带来哪些优势?,0
312,明天有个访客过来,我要接待,云智眼的主要功能有哪些?,0
313,明天有个访客过来,我要接待,软件开发的主要领域有哪些?,0
314,我来找一下你们公司的卢总,公司如何实现客户价值最大化?,0
315,我来找一下你们公司的卢总,介绍一下联想集团,0
316,我来找一下你们公司的卢总,人力资源部的主要职责是什么?,0
317,我来找一下你们公司的卢总,销售部的主要职责是什么?,0
318,我来找一下你们公司的朱总,介绍一下联想集团,0
319,我来找一下你们公司的朱总,公司的发展历程是怎样的?,0
320,我来找一下你们公司的朱总,公司愿景是什么?,0
321,我来找一下你们公司的朱总,企业介绍是什么?,0
322,找一下你们公司的王总,公司愿景是什么?,0
323,找一下你们公司的王总,公司使命是什么?,0
324,找一下你们公司的王总,介绍一下联想集团,0
325,找一下你们公司的王总,公司的发展历程是怎样的?,0
326,你们公司的魏工在吗,泰克威团队的特点是什么?,0
327,你们公司的魏工在吗,公司如何确保员工的持续学习和发展?,0
328,你们公司的魏工在吗,泰克威成立于哪一年?,0
329,你们公司的魏工在吗,公司的发展历程是怎样的?,0
330,你好,你们公司的王工在吗,缔智元科技提供哪些数字员工产品?,0
331,你好,你们公司的王工在吗,公司的主要产品,0
332,你好,你们公司的王工在吗,企业通过数字员工能带来哪些优势?,0
333,你好,你们公司的王工在吗,公司如何确保多元文化的尊重?,0
334,我来找一下你们的王工,企业通过数字员工能带来哪些优势?,0
335,我来找一下你们的王工,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
336,我来找一下你们的王工,公司如何确保员工的持续学习和发展?,0
337,我来找一下你们的王工,介绍一下联想集团,0
338,王总在公司吗,高级管理层的主要职责是什么?,0
339,王总在公司吗,公司如何实现客户价值最大化?,0
340,王总在公司吗,公司的主要产品,0
341,王总在公司吗,销售部的主要职责是什么?,0
342,我找一下李工,泰克威成立于哪一年?,0
343,我找一下李工,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
344,我找一下李工,企业通过数字员工能带来哪些优势?,0
345,我找一下李工,介绍一下联想集团,0
346,刘工在吗,行政部主要负责哪些工作?,0
347,刘工在吗,企业通过数字员工能带来哪些优势?,0
348,刘工在吗,缔智元科技提供哪些数字员工产品?,0
349,刘工在吗,公司如何确保员工的持续学习和发展?,0
350,我想约个会,介绍一下联想集团,0
351,我想约个会,泰克威位于哪个地区?,0
352,我想约个会,园区拥有多少个孵化器?,0
353,我想约个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
354,我要开个会,软件开发的主要领域有哪些?,0
355,我要开个会,董事会的主要职责是什么?,0
356,我要开个会,泰克威位于哪个地区?,0
357,我要开个会,园区拥有多少个孵化器?,0
358,给我订个会,泰克威位于哪个地区?,0
359,给我订个会,园区拥有多少个孵化器?,0
360,给我订个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
361,给我订个会,董事会的主要职责是什么?,0
362,帮我订个会,泰克威位于哪个地区?,0
363,帮我订个会,园区拥有多少个孵化器?,0
364,帮我订个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
365,帮我订个会,董事会的主要职责是什么?,0
366,帮我约个会,泰克威位于哪个地区?,0
367,帮我约个会,园区拥有多少个孵化器?,0
368,帮我约个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
369,帮我约个会,董事会的主要职责是什么?,0
370,讲一下,泰克威团队的特点是什么?,0
371,讲一下,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
372,讲一下,1949年9月27日,中国人民政治协商会议第一届全体会议决定将北平更名为北京市的原因是什么?,0
373,讲一下,常见问题解答是什么?,0
374,你们有哪些数字人,缔智元科技提供哪些数字员工产品?,0
375,你们有哪些数字人,企业通过数字员工能带来哪些优势?,0
376,你们有哪些数字人,云计算与大数据的主要区别是什么?,0
377,你们有哪些数字人,园区服务覆盖了多少人群?,0
378,你们公司使命是什么,公司使命是什么?,0
379,你们公司使命是什么,公司愿景是什么?,0
380,你们公司使命是什么,公司如何实现客户价值最大化?,0
381,你们公司使命是什么,泰克威的使命是什么?,0
382,你们公司的股票是什么样的,公司的主要产品,0
383,你们公司的股票是什么样的,公司的发展历程是怎样的?,0
384,你们公司的股票是什么样的,泰克威是什么类型的公司?,0
385,你们公司的股票是什么样的,公司组织结构是如何设计的?,0
386,你们公司员工待遇怎么样,公司如何确保员工的持续学习和发展?,0
387,你们公司员工待遇怎么样,公司如何确保多元文化的尊重?,0
388,你们公司员工待遇怎么样,企业通过数字员工能带来哪些优势?,0
389,你们公司员工待遇怎么样,公司如何实现客户价值最大化?,0

+ 91
- 0
data/test.csv Vedi File

@@ -0,0 +1,91 @@
,question,answer,label
0,介绍下你们的产品,常见问题解答是什么?,0
1,园区入住了多少家公司,园区服务覆盖了多少人群?,0
2,东升杯创业大赛已经举办了多少届了?,园区孵化了多少家企业?,0
3,我来找一下你们公司的卢总,介绍一下联想集团,0
4,帮我约个会,泰克威位于哪个地区?,0
5,你们园区有哪些产业,园区服务覆盖了多少人群?,0
6,你们公司的魏工在吗,公司的发展历程是怎样的?,0
7,你们公司的股票是什么样的,公司的主要产品,0
8,你们公司的股票是什么样的,公司组织结构是如何设计的?,0
9,你们园区有哪些产业,园区孵化了多少家企业?,0
10,有过多少次东升杯,园区拥有多少个孵化器?,0
11,园区有多少企业,园区有多少家高精尖企业?,1
12,我来找一下你们公司的朱总,企业介绍是什么?,0
13,你们服务覆盖了些什么,园区服务覆盖了多少人群?,1
14,我来找一下你们公司的朱总,介绍一下联想集团,0
15,东升跟那些机构有过合作,中关村东升科技园与哪些科研机构有合作?,1
16,介绍一下园区企业情况,园区孵化了多少家企业?,1
17,1哪些科研机构是你们的合作伙伴?,中关村东升科技园与哪些科研机构有合作?,1
18,你们的使命是什么,公司愿景是什么?,0
19,帮我预约个会议,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
20,你们的产品用了哪些技术,公司如何实现客户价值最大化?,0
21,你们的产品有哪些亮点,缔智元科技的产品综合了哪些前沿技术?,0
22,帮我约个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
23,我怎么能够到达办事大厅,忘记密码后如何操作?,0
24,你们的产品有哪些亮点,缔智元科技提供哪些数字员工产品?,1
25,讲一下,常见问题解答是什么?,0
26,总服务台在哪里,销售部的主要职责是什么?,0
27,你们公司的魏工在吗,公司如何确保员工的持续学习和发展?,0
28,科技园有哪些合作对象,园区有哪些优势?,0
29,介绍下你们的优势,云计算与大数据的主要区别是什么?,0
30,我怎么能够到达办事大厅,总服务台怎么走,0
31,你们有哪些数字人,园区服务覆盖了多少人群?,0
32,你们公司有什么规定,公司愿景是什么?,0
33,客人登记,注册资本是多少?,0
34,你们有什么优势,泰克威团队的特点是什么?,0
35,你们如何推动科创发展,公司如何确保员工的持续学习和发展?,0
36,你们公司愿景是什么,泰克威是什么类型的公司?,0
37,总服务台在哪里,技术咨询与培训包括哪些服务?,0
38,科技园有哪些合作机构,中关村东升科技园与哪些科研机构有合作?,1
39,介绍一下你们的产品,联通提供了哪些网络类产品?,0
40,介绍一下你自己,企业介绍是什么?,0
41,介绍一下你们的合作对象,介绍一下联想集团,0
42,给我订个会,泰克威位于哪个地区?,0
43,介绍一下你们的愿景,公司使命是什么?,0
44,你们的产品有哪些亮点,公司的主要产品,1
45,你们的产品有哪些亮点,联通提供了哪些网络类产品?,0
46,你们公司的工作时间是什么,公司愿景是什么?,0
47,讲一下,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
48,你的价值观是是什么,如何建立和发展企业文化?,0
49,介绍下你们的产品,企业介绍是什么?,0
50,你们会怎么继续发展,创新是如何推动企业发展的?,0
51,你们们的工作时间是什么,敬业精神的具体表现是什么?,0
52,介绍一下你们公司,企业介绍是什么?,0
53,你们公司使命是什么,公司愿景是什么?,0
54,有过多少次东升杯,中关村东升科技园与哪些科研机构有合作?,0
55,你们愿景是啥,公司愿景是什么?,0
56,东升杯举办过多少次,未来,中关村东升科技园将如何推动科创发展?,0
57,你好,你们公司的王工在吗,缔智元科技提供哪些数字员工产品?,0
58,你们的服务是面向谁,商务楼宇/园区专区是面向哪些对象的?,0
59,科技园有哪些合作机构,园区有哪些优势?,0
60,讲一讲你们的产品,企业介绍是什么?,0
61,我来找一下你们的王工,介绍一下联想集团,0
62,我想约个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
63,你们能提供哪些产品,缔智元科技的产品综合了哪些前沿技术?,0
64,园区入住了多少家公司,园区孵化了多少家企业?,1
65,请问服务台在哪,总服务台怎么走,1
66,你们有什么愿景,公司使命是什么?,0
67,你们孵化了多少家企业,企业文化对企业的重要性有哪些?,0
68,介绍下你们的优势,企业通过数字员工能带来哪些优势?,0
69,讲一下,泰克威团队的特点是什么?,0
70,介绍一下你们的产品,介绍一下联想集团,0
71,东升杯创业大赛已经举办了多少届了?,中关村东升科技园举办了多少次东升杯创业大赛?,1
72,你们有什么长处,园区有哪些优势?,1
73,客人登记,总服务台怎么走,0
74,给我订个会,园区拥有多少个孵化器?,0
75,你们公司使命是什么,公司如何实现客户价值最大化?,0
76,你们公司员工待遇怎么样,公司如何实现客户价值最大化?,0
77,你们有什么产品,缔智元科技的产品综合了哪些前沿技术?,0
78,讲一下你们的愿景,公司愿景是什么?,0
79,介绍下你们的优势,介绍一下联想集团,0
80,找一下你们公司的王总,公司使命是什么?,0
81,我该怎么去总服务台,总服务台位置,1
82,帮我订个会,泰克威位于哪个地区?,0
83,那你们的价值观呢,企业文化与价值观的定义是什么?,0
84,说下你们的优势,园区有哪些优势?,1
85,找一下你们公司的王总,公司愿景是什么?,0
86,你们产品优势在哪里,企业通过数字员工能带来哪些优势?,0
87,那你们的价值观呢,公司如何确保多元文化的尊重?,0
88,东升杯举办过多少次,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
89,你们公司员工待遇怎么样,企业通过数字员工能带来哪些优势?,0

+ 301
- 0
data/train.csv Vedi File

@@ -0,0 +1,301 @@
,question,answer,label
0,你们有什么规定啊,二、主要业务范围是什么?,0
1,你们有什么产品,云智眼是什么类型的产品?,0
2,办事大厅在哪里,行政部主要负责哪些工作?,0
3,王总在公司吗,销售部的主要职责是什么?,0
4,你们会怎么继续发展,公司的发展历程是怎样的?,0
5,你们有哪些合作对象,公司的主要产品,0
6,怎么去总服务台,忘记密码后如何操作?,0
7,介绍下你们的产品,缔智元科技的产品综合了哪些前沿技术?,0
8,怎么去总服务台,总服务台怎么走,1
9,讲讲你们的优点在哪里,泰克威团队的特点是什么?,0
10,你们公司使命是什么,公司使命是什么?,0
11,你们的产品用了哪些技术,公司的主要产品,0
12,那你们的价值观呢,诚信经营的核心价值观是什么?,0
13,讲一下你们的愿景,企业如何实现长远发展?,0
14,介绍一下你们的愿景,公司愿景是什么?,0
15,我该怎么到办事大厅,总服务台怎么走,0
16,讲一下,1949年9月27日,中国人民政治协商会议第一届全体会议决定将北平更名为北京市的原因是什么?,0
17,你们会怎么推动发展,企业如何实现长远发展?,0
18,讲一下你们的愿景,公司使命是什么?,0
19,我来找一下你们公司的卢总,公司如何实现客户价值最大化?,0
20,你们能提供哪些产品,联通提供了哪些网络类产品?,0
21,明天有个访客过来,我要接待,企业通过数字员工能带来哪些优势?,0
22,你们的优势在哪里,团队合作的重要性是什么?,0
23,你们有什么长处,泰克威团队的特点是什么?,0
24,介绍一下你自己,团队合作的重要性是什么?,0
25,总服务台在哪里,总服务台怎么走,1
26,你们有哪些数字人,缔智元科技提供哪些数字员工产品?,0
27,你们的优势在哪里,泰克威团队的特点是什么?,0
28,你们公司愿景是什么,公司如何实现客户价值最大化?,0
29,你们如何推动科创发展,未来,中关村东升科技园将如何推动科创发展?,1
30,介绍一下你们公司,公司的主要产品,0
31,帮我约一个明天下午的会议,北京市人民政府与北京市人民代表大会的关系是什么?,0
32,说说你们的产品,介绍一下联想集团,0
33,你们公司的工作时间是什么,公司使命是什么?,0
34,东升杯举办过多少次,中关村东升科技园举办了多少次东升杯创业大赛?,1
35,你们想要达到的目的是什么,企业如何实现长远发展?,0
36,怎么去办事大厅,公司的发展历程是怎样的?,0
37,我要开个会,董事会的主要职责是什么?,0
38,介绍一下园区企业情况,什么是商务楼宇/园区专区?,0
39,你们的优势在哪里,园区有哪些优势?,1
40,你们的服务是面向谁,智慧楼宇平台的主要目标用户是谁?,0
41,帮我约个会议,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
42,你们的愿景是什么,公司愿景是什么?,0
43,园区里有多少企业,园区拥有多少个孵化器?,0
44,介绍一下你们的合作对象,团队合作的重要性是什么?,0
45,你们的使命是什么,公司使命是什么?,0
46,介绍一下你自己,公司的发展历程是怎样的?,0
47,请问办事大厅在哪,常见问题解答是什么?,0
48,你们想要达到的目的是什么,智慧楼宇平台的主要目标用户是谁?,0
49,你们的工作时间是几点,成立时间是什么时候?,0
50,科技园有哪些合作对象,园区有多少家高精尖企业?,0
51,你们服务覆盖了些什么,技术咨询与培训包括哪些服务?,0
52,找一下你们公司的王总,公司的发展历程是怎样的?,0
53,园区里有多少企业,园区服务覆盖了多少人群?,0
54,1哪些科研机构是你们的合作伙伴?,缔智元科技的产品综合了哪些前沿技术?,0
55,你们有什么优势,公司如何实现客户价值最大化?,0
56,介绍一下园区企业情况,园区有多少家高精尖企业?,1
57,你们如何推动科创发展,如何建立和发展企业文化?,0
58,我找一下李工,泰克威成立于哪一年?,0
59,你们有什么愿景,企业如何实现长远发展?,0
60,我想约个会,介绍一下联想集团,0
61,明天有个客人要来,帮我做个登记,云智眼的主要功能有哪些?,0
62,你们有什么愿景,公司愿景是什么?,0
63,帮我订个会,园区拥有多少个孵化器?,0
64,你们会怎么继续发展,企业如何实现长远发展?,0
65,你们的产品有哪些亮点,园区有哪些优势?,0
66,刘工在吗,行政部主要负责哪些工作?,0
67,你们都跟谁有过合作,中关村东升科技园与哪些科研机构有合作?,1
68,科技园有哪些合作对象,中关村东升科技园与哪些科研机构有合作?,1
69,明天有个访客过来,我要接待,园区拥有多少个孵化器?,0
70,你们的优势在哪里,企业通过数字员工能带来哪些优势?,0
71,你们都跟谁有过合作,团队合作的重要性是什么?,0
72,讲讲你们的优点在哪里,敬业精神的具体表现是什么?,0
73,你们园区承接了哪些产业,中关村东升科技园承接了哪些战略性新兴产业?,1
74,讲讲你们的优点在哪里,团队合作的重要性是什么?,0
75,总服务台在哪里,总服务台位置,1
76,你们想要达到的目的是什么,公司使命是什么?,0
77,你们如何推动科创发展,中关村东升科技园承接了哪些战略性新兴产业?,0
78,你们公司的工作时间是几点,人力资源部的主要职责是什么?,0
79,你们有什么产品,缔智元科技提供哪些数字员工产品?,1
80,你们孵化了多少家企业,公司的发展历程是怎样的?,0
81,我要去办事大厅,北京市人民政府机关搬迁的时间和地点是什么?,0
82,你的价值观是是什么,公司使命是什么?,0
83, 你们有多少公司入驻,注册资本是多少?,0
84,园区里有多少企业,园区孵化了多少家企业?,1
85,东升跟那些机构有过合作,中关村东升科技园承接了哪些战略性新兴产业?,0
86,你们园区有哪些产业,园区有哪些优势?,0
87,我来找一下你们公司的朱总,公司的发展历程是怎样的?,0
88,园区里的产业有哪些,园区孵化了多少家企业?,0
89,帮我约个会议,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
90,你们的产品有哪些亮点,云智眼是什么类型的产品?,0
91,我该怎么到办事大厅,云计算与大数据的主要区别是什么?,0
92,介绍一下你们的产品,云智眼是什么类型的产品?,0
93,园区有多少企业,园区孵化了多少家企业?,1
94,你们们的工作时间是什么,行政部主要负责哪些工作?,0
95,帮我约个会议,园区拥有多少个孵化器?,0
96,找一下你们公司的王总,介绍一下联想集团,0
97,怎么去办事大厅,云计算与大数据的主要区别是什么?,0
98,请问办事大厅在哪,行政部主要负责哪些工作?,0
99,你们有多少孵化器,园区有多少家高精尖企业?,0
100,你们的产品有哪些亮点,消安防管理套件包括哪些产品?,0
101,你们想要达到的目的是什么,公司如何实现客户价值最大化?,0
102,我想去一下卫生间,卫生间怎么走,忘记密码后如何操作?,0
103,我要去办事大厅,公司如何实现客户价值最大化?,0
104,明天有个客人要来,帮我做个登记,忘记密码后如何操作?,0
105,帮我约一个明天下午的会议,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
106,介绍一下你们的愿景,企业如何实现长远发展?,0
107,你们的服务是面向谁,总服务台位置,0
108, 你们有多少公司入驻,园区拥有多少个孵化器?,0
109,你们的愿景是什么,企业如何实现长远发展?,0
110,帮我约个会,董事会的主要职责是什么?,0
111,请问服务台在哪,智慧楼宇平台的物业管理模块包含哪些功能?,0
112,帮我做个登记,园区拥有多少个孵化器?,0
113,你们有什么优势,团队合作的重要性是什么?,0
114,园区有多少企业,园区服务覆盖了多少人群?,0
115,你们的使命是什么,泰克威的使命是什么?,0
116,讲一讲你们的产品,缔智元科技提供哪些数字员工产品?,1
117,怎么去办事大厅,忘记密码后如何操作?,0
118,你们的使命是什么,团队合作的重要性是什么?,0
119,你们公司的股票是什么样的,公司的发展历程是怎样的?,0
120,你们公司的工作时间是几点,行政部主要负责哪些工作?,0
121,我该怎么去总服务台,总服务台怎么走,1
122,你们服务覆盖了些什么,联通提供了哪些网络类产品?,0
123,你们的工作时间是几点,团队合作的重要性是什么?,0
124,我要去办事大厅,行政部主要负责哪些工作?,0
125,你们愿景是啥,公司使命是什么?,0
126,帮我约一个明天下午的会议,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
127,说说你们的产品,常见问题解答是什么?,0
128,你们有什么优势,企业通过数字员工能带来哪些优势?,0
129,帮我预约个会议,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
130,你们的服务是面向谁,园区服务覆盖了多少人群?,1
131,介绍一下你个人的优势,企业通过数字员工能带来哪些优势?,0
132,园区里有多少企业,园区有多少家高精尖企业?,1
133,你们园区有哪些产业,园区有多少家高精尖企业?,0
134, 你们有多少公司入驻,园区有多少家高精尖企业?,1
135,怎么去总服务台,技术咨询与培训包括哪些服务?,0
136,你们有什么规定啊,公司如何确保多元文化的尊重?,0
137,你们的产品用了哪些技术,缔智元科技提供哪些数字员工产品?,0
138,客人登记,忘记密码后如何操作?,0
139,你们有什么规定啊,北京市人民政府实行什么样的管理制度?,0
140,给我订个会,董事会的主要职责是什么?,0
141,帮我预约个会议,1949年9月27日,中国人民政治协商会议第一届全体会议决定将北平更名为北京市的原因是什么?,0
142,你们的愿景是什么,泰克威的使命是什么?,0
143,你们公司愿景是什么,公司愿景是什么?,0
144,你们想要达到的目的是什么,网络与信息安全的主要目标是什么?,0
145,东升跟那些机构有过合作,未来,中关村东升科技园将如何推动科创发展?,0
146,我想约个会,园区拥有多少个孵化器?,0
147,你们有多少孵化器,中关村东升科技园举办了多少次东升杯创业大赛?,0
148,东升跟那些机构有过合作,中关村东升科技园举办了多少次东升杯创业大赛?,0
149,你们有哪些数字人,云计算与大数据的主要区别是什么?,0
150,你们公司有什么规定,公司如何确保员工的持续学习和发展?,0
151,你们想要达到的目的是什么,商务楼宇/园区专区的目标是什么?,0
152,介绍一下你们的产品,缔智元科技的产品综合了哪些前沿技术?,1
153,你们有哪些合作对象,介绍一下联想集团,0
154,介绍一下你自己,介绍一下联想集团,0
155,我来找一下你们的王工,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
156,你们园区承接了哪些产业,园区服务覆盖了多少人群?,0
157,我要开个会,泰克威位于哪个地区?,0
158,王总在公司吗,公司如何实现客户价值最大化?,0
159,科技园有哪些合作机构,缔智元科技的产品综合了哪些前沿技术?,0
160,我想去一下卫生间,卫生间怎么走,总服务台怎么走,0
161,你们公司的工作时间是几点,公司如何确保多元文化的尊重?,0
162,科技园有哪些合作对象,中关村东升科技园承接了哪些战略性新兴产业?,0
163,你们公司使命是什么,泰克威的使命是什么?,0
164,你们愿景是啥,企业如何实现长远发展?,0
165,说下你们的优势,企业通过数字员工能带来哪些优势?,0
166,园区入住了多少家公司,园区拥有多少个孵化器?,0
167,你们都跟谁有过合作,智慧楼宇平台的主要目标用户是谁?,0
168,我想约个会,泰克威位于哪个地区?,0
169,有过多少次东升杯,未来,中关村东升科技园将如何推动科创发展?,0
170,你们们的工作时间是什么,财务部的主要职责是什么?,0
171,你们会怎么推动发展,如何建立和发展企业文化?,0
172,你们公司的魏工在吗,泰克威成立于哪一年?,0
173,我来找一下你们的王工,企业通过数字员工能带来哪些优势?,0
174,你们会怎么推动发展,未来,中关村东升科技园将如何推动科创发展?,1
175,刘工在吗,企业通过数字员工能带来哪些优势?,0
176,帮我做个登记,泰克威位于哪个地区?,0
177,你们公司员工待遇怎么样,公司如何确保多元文化的尊重?,0
178,你的价值观是是什么,诚信经营的核心价值观是什么?,0
179,你们愿景是啥,公司如何实现客户价值最大化?,0
180,你们的工作时间是几点,北京市人民政府机关搬迁的时间和地点是什么?,0
181,讲一讲你们的产品,介绍一下联想集团,0
182,说下你们的优势,团队合作的重要性是什么?,0
183,你们有什么愿景,公司如何实现客户价值最大化?,0
184,介绍一下你个人的优势,园区有哪些优势?,0
185,帮我预约个会议,云智眼如何实现事前预警和事中可控?,0
186,你们有什么规定啊,常见问题解答是什么?,0
187,你们园区承接了哪些产业,园区孵化了多少家企业?,0
188,说下你们的优势,泰克威团队的特点是什么?,0
189,明天有个访客过来,我要接待,软件开发的主要领域有哪些?,0
190,我来找一下你们公司的朱总,公司愿景是什么?,0
191,你们服务覆盖了些什么,总服务台位置,0
192,刘工在吗,缔智元科技提供哪些数字员工产品?,0
193,东升杯创业大赛已经举办了多少届了?,中关村东升科技园承接了哪些战略性新兴产业?,0
194,你们有什么产品,联通提供了哪些网络类产品?,0
195,我怎么能够到达办事大厅,公司的发展历程是怎样的?,0
196,王总在公司吗,高级管理层的主要职责是什么?,0
197,你们产品优势在哪里,缔智元科技的产品综合了哪些前沿技术?,1
198,请问服务台在哪,园区服务覆盖了多少人群?,0
199,明天有个客人要来,帮我做个登记,园区拥有多少个孵化器?,0
200,你们公司的魏工在吗,泰克威团队的特点是什么?,0
201,1哪些科研机构是你们的合作伙伴?,园区有多少家高精尖企业?,0
202,办事大厅在哪里,北京市人民政府机关搬迁的时间和地点是什么?,0
203,介绍一下你个人的优势,泰克威团队的特点是什么?,0
204,你们有什么优势,园区有哪些优势?,1
205,帮我约个会,园区拥有多少个孵化器?,0
206,讲一下你们的愿景,公司如何实现客户价值最大化?,0
207,办事大厅在哪里,园区服务覆盖了多少人群?,0
208,你好,你们公司的王工在吗,公司的主要产品,0
209,你们都跟谁有过合作,公司如何实现客户价值最大化?,0
210,我来找一下你们公司的卢总,人力资源部的主要职责是什么?,0
211,怎么去总服务台,总服务台位置,1
212,你们的愿景是什么,公司如何实现客户价值最大化?,0
213,介绍一下你们的合作对象,企业介绍是什么?,0
214,有过多少次东升杯,中关村东升科技园举办了多少次东升杯创业大赛?,1
215,我找一下李工,企业通过数字员工能带来哪些优势?,0
216,1哪些科研机构是你们的合作伙伴?,公司组织结构是如何设计的?,0
217,你们有什么长处,企业通过数字员工能带来哪些优势?,0
218,科技园有哪些合作机构,团队合作的重要性是什么?,0
219,东升杯举办过多少次,中关村东升科技园与哪些科研机构有合作?,0
220,你们有多少孵化器,园区拥有多少个孵化器?,1
221,办事大厅在哪里,北京市人民政府的主要职责是什么?,0
222,你们公司员工待遇怎么样,公司如何确保员工的持续学习和发展?,0
223,你们们的工作时间是什么,人力资源部的主要职责是什么?,0
224,园区有多少企业,园区拥有多少个孵化器?,0
225,刘工在吗,公司如何确保员工的持续学习和发展?,0
226,你们的工作时间是几点,行政部主要负责哪些工作?,0
227,你们有哪些合作对象,公司如何实现客户价值最大化?,0
228,我要开个会,园区拥有多少个孵化器?,0
229,帮我订个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
230,客人登记,总服务台位置,0
231,你们公司的工作时间是什么,公司如何确保员工的持续学习和发展?,0
232, 你们有多少公司入驻,园区孵化了多少家企业?,1
233,你好,你们公司的王工在吗,公司如何确保多元文化的尊重?,0
234,介绍一下你们的愿景,公司如何实现客户价值最大化?,0
235,园区里的产业有哪些,园区有多少家高精尖企业?,0
236,说说你们的产品,缔智元科技提供哪些数字员工产品?,1
237,我要开个会,软件开发的主要领域有哪些?,0
238,介绍一下园区企业情况,园区服务覆盖了多少人群?,0
239,给我订个会,中央人民政府委员会第四次会议通过任命北京市人民政府委员会名单的时间是哪一天?,0
240,介绍一下你们公司,公司使命是什么?,0
241,你的价值观是是什么,企业文化与价值观的定义是什么?,0
242,你们孵化了多少家企业,园区孵化了多少家企业?,1
243,东升杯创业大赛已经举办了多少届了?,未来,中关村东升科技园将如何推动科创发展?,0
244,我要去办事大厅,总服务台怎么走,0
245,你们有哪些合作对象,团队合作的重要性是什么?,0
246,你们产品优势在哪里,缔智元科技提供哪些数字员工产品?,0
247,你们想要达到的目的是什么,公司愿景是什么?,0
248,那你们的价值观呢,公司如何实现客户价值最大化?,0
249,请问办事大厅在哪,北京市人民政府机关搬迁的时间和地点是什么?,0
250,你们会怎么推动发展,公司如何确保员工的持续学习和发展?,0
251,你们园区承接了哪些产业,园区有多少家高精尖企业?,0
252,你们有什么长处,团队合作的重要性是什么?,0
253,我该怎么去总服务台,技术咨询与培训包括哪些服务?,0
254,我该怎么到办事大厅,忘记密码后如何操作?,0
255,你们能提供哪些产品,缔智元科技提供哪些数字员工产品?,1
256,介绍下你们的优势,企业介绍是什么?,0
257,王总在公司吗,公司的主要产品,0
258,你们有哪些数字人,企业通过数字员工能带来哪些优势?,0
259,你们公司愿景是什么,公司使命是什么?,0
260,帮我约个会议,董事会的主要职责是什么?,0
261,你们公司的股票是什么样的,泰克威是什么类型的公司?,0
262,你们公司有什么规定,公司如何确保多元文化的尊重?,0
263,明天有个访客过来,我要接待,云智眼的主要功能有哪些?,0
264,介绍下你们的产品,公司的主要产品,1
265,你们能提供哪些产品,消安防管理套件包括哪些产品?,0
266,你们公司有什么规定,北京市人民政府实行什么样的管理制度?,0
267,我找一下李工,北京市第二届第一次各界人民代表会议选举市长、副市长的时间是哪一天?,0
268,讲讲你们的优点在哪里,园区有哪些优势?,1
269,请问服务台在哪,总服务台位置,1
270,你们公司的工作时间是几点,公司如何确保员工的持续学习和发展?,0
271,我想去一下卫生间,卫生间怎么走,常见问题解答是什么?,0
272,园区里的产业有哪些,中关村东升科技园承接了哪些战略性新兴产业?,1
273,园区入住了多少家公司,园区有多少家高精尖企业?,1
274,你们公司的工作时间是什么,公司组织结构是如何设计的?,0
275,你们的产品用了哪些技术,缔智元科技的产品综合了哪些前沿技术?,1
276,说说你们的产品,缔智元科技的产品综合了哪些前沿技术?,0
277,介绍一下你们的合作对象,中关村东升科技园与哪些科研机构有合作?,1
278,我想去一下卫生间,卫生间怎么走,总服务台位置,0
279,帮我订个会,董事会的主要职责是什么?,0
280,我来找一下你们的王工,公司如何确保员工的持续学习和发展?,0
281,你们会怎么继续发展,公司如何确保员工的持续学习和发展?,0
282,帮我做个登记,忘记密码后如何操作?,0
283,讲一讲你们的产品,缔智元科技的产品综合了哪些前沿技术?,0
284,你们孵化了多少家企业,园区拥有多少个孵化器?,0
285,介绍一下你们公司,介绍一下联想集团,0
286,明天有个客人要来,帮我做个登记,泰克威位于哪个地区?,0
287,你们有多少孵化器,园区孵化了多少家企业?,0
288,我来找一下你们公司的卢总,销售部的主要职责是什么?,0
289,你们产品优势在哪里,泰克威团队的特点是什么?,0
290,帮我约一个明天下午的会议,北京市人民政府机关搬迁的时间和地点是什么?,0
291,我该怎么到办事大厅,公司的发展历程是怎样的?,0
292,园区里的产业有哪些,园区服务覆盖了多少人群?,0
293,我该怎么去总服务台,忘记密码后如何操作?,0
294,怎么去办事大厅,总服务台怎么走,0
295,介绍一下你个人的优势,团队合作的重要性是什么?,0
296,你好,你们公司的王工在吗,企业通过数字员工能带来哪些优势?,0
297,请问办事大厅在哪,北京市人民政府的主要职责是什么?,0
298,我怎么能够到达办事大厅,中关村东升科技园举办了多少次东升杯创业大赛?,0
299,我找一下李工,介绍一下联想集团,0

+ 56
- 0
dataget.py Vedi File

@@ -0,0 +1,56 @@
import json
import pandas as pd
import numpy as np


with open(r"D:/code/score_test/data/nlt_info_20230926.log",
"r",
encoding='ANSI') as f:
data = f.read()
data = data.split('\n')
count = 0
C = 0
all = 0
json_list = []
for i in range(len(data)):
all += 1
temp = '{' + data[i] + '}'
d = temp.find('"recommend')
e = temp.find('"recommendlist')
if d < 0:
continue
if d > 0 and e > 0:
continue
t = json.loads(temp)
json_list.append(t)
data1 = pd.DataFrame(json_list)
data2 = pd.read_csv('D:/code/score_test/data/20230829评分系统材料.csv')

questionDict = {}
for i in range(data2.shape[0]):
temp = data2.loc[i, 'question']
temp_answer = data2.loc[i, 'expected']
if not temp_answer == '空':
expected_list = temp_answer.split('/')
else:
expected_list = []
questionDict[temp] = expected_list


dataw = []
for i in range(data1.shape[0]):
temp = data1.loc[i, 'question']
temp_answer = data1.loc[i, 'answers']
for j in range(len(temp_answer)):
if temp_answer[j][0] in questionDict[temp]:
dataw.append([temp, temp_answer[j][0], 1])
else:
dataw.append([temp, temp_answer[j][0], 0])

datas = []
for i in dataw:
if i not in datas:
datas.append(i)
print(len(datas))
dd = pd.DataFrame(datas, columns=['question', 'answer', 'label'])
dd.to_csv('data.csv', encoding="utf_8_sig")

+ 97
- 0
double_towerasd.py Vedi File

@@ -0,0 +1,97 @@
import torch
import dashscope
from http import HTTPStatus
from dashscope import TextEmbedding
from torch import nn
import torch.optim as optim
import pandas as pd
import numpy as np
dashscope.api_key = 'sk-44ccc9ab5e754eddb545cade12b632cf'
cache = {}
answerCache = []


def getem(question):
global cache
if question in cache.keys():
return cache[question]
resp = TextEmbedding.call(model=TextEmbedding.Models.text_embedding_v1,
input=question,
text_type='query')
if resp.status_code == HTTPStatus.OK:
cache[question] = resp['output']['embeddings'][0]['embedding']
return resp['output']['embeddings'][0]['embedding']




# 创建模型实例
model = ConvNet()

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

train = []
test = []
dataall = pd.read_csv('data.csv')
dataall = dataall.iloc[:, 1:4]

dataall = dataall.sample(frac=1)
train = dataall.iloc[0:300]
train = train.reset_index(drop=True)
test = dataall.iloc[300:]
test = test.reset_index(drop=True)
nlossLast = 0
for i in range(10):
nloss = 0
for k in range(len(train)):
va = getem(train.iloc[k]['question'])
vb = getem(train.iloc[k]['answer'])
if train.iloc[k]['answer'] not in answerCache:
answerCache.append(train.iloc[k]['answer'])
va = torch.Tensor(va).reshape([1, 1, 1536])
vb = torch.Tensor(vb).reshape([1, 1, 1536])
output = model(va, vb)
# 计算损失
if train.iloc[k]['label'] == 1:
loss = criterion(output,
torch.tensor(1).float())
else:
loss = criterion(output,
torch.tensor(0).float())
# 反向传播并更新权重
optimizer.zero_grad()
loss.backward()
optimizer.step()
nloss += loss
if k % 50 == 0:
print(i, k, 'done')
print('one loop done', nloss/len(train))


p = 0
for i in range(len(test)):
va = getem(test.iloc[i]['question'])
Scores = np.zeros(len(answerCache))
for j in range(len(answerCache)):
vb = getem(answerCache[j])
vaa = torch.Tensor(va).reshape([1, 1, len(va)])
vbb = torch.Tensor(vb).reshape([1, 1, len(vb)])
output = model(vaa, vbb)
Scores[j] = output
for k in range(2):
if test.iloc[i]['label'] == 1:
vc = test.iloc[i]['answer']
else:
vc = ''
tt = Scores.argmax()
if Scores[tt] > 0.5:
vb = answerCache[tt]
Scores[tt] = -1
else:
vb = ''
if vb == vc:
p += 1
break
print(p/len(test))

+ 0
- 0
embeddings/__init__.py Vedi File


+ 22
- 0
embeddings/dashscopeembedding.py Vedi File

@@ -0,0 +1,22 @@
# coding=utf-8
from embeddings.embedding import Embedding
import dashscope
from http import HTTPStatus
from dashscope import TextEmbedding


class Dashscopeembedding(Embedding):
def __init__(self, **param):
dashscope.api_key = param['api_key']
self.cache = {}

def getem(self, question):
if question in self.cache.keys():
return self.cache['question']
resp = TextEmbedding.call(model=TextEmbedding.Models.text_embedding_v1,
input=question,
text_type='query')
if resp.status_code == HTTPStatus.OK:
em = resp['output']['embeddings'][0]['embedding']
self.cache['question'] = em
return em

+ 12
- 0
embeddings/embedding.py Vedi File

@@ -0,0 +1,12 @@
# coding=utf-8
from abc import ABC, abstractmethod


class Embedding(ABC):
@abstractmethod
def __init__(self, **param):
pass

@abstractmethod
def getem(self, question):
pass

+ 27
- 0
embeddings/liandongembedding.py Vedi File

@@ -0,0 +1,27 @@
# coding=utf-8
from embeddings.embedding import Embedding
import requests
import json


class Liandongembedding(Embedding):
def __init__(self, **param):
self.url = param['api_url']
self.cache = {}

def getem(self, question):
if question in self.cache.keys():
return self.cache['question']
headers = {
'Content-Type': 'application/json',
'Content-Length': '<calculated when request is sent>'
}
data = {
"text": question
}
result = requests.post(self.url,
headers=headers,
data=json.dumps(data))
em = json.loads(result.content)['data']
self.cache['question'] = em
return em

+ 16
- 0
embeddings/zhipuembedding.py Vedi File

@@ -0,0 +1,16 @@
# coding=utf-8
import zhipuai
from embeddings.embedding import Embedding


class Zhipuembedding(Embedding):
def __init__(self, **param):
zhipuai.api_key = param['api_key']
self.cache = {}

def getem(self, question):
response = zhipuai.model_api.invoke(model="text_embedding",
prompt=question)
em = response['data']['embedding']
self.cache['question'] = em
return em

+ 85
- 0
main.py Vedi File

@@ -0,0 +1,85 @@
import sys
import configparser
import pandas as pd
import torch
from torch import nn
import torch.optim as optim


def main(**param):
L ={"dashscope":1536, "liandong":1024, "zhipu":1024}
answerCache = []

config = configparser.ConfigParser()
config.read("settings.ini", encoding="utf-8")
modelName = param['model']
embeddings = param['embedding']
mode = param['mode']
print(modelName, embeddings, mode)

emName = embeddings + 'embedding'
embedding_config = dict(config.items(emName))
ems = __import__('embeddings.%s' % emName,
fromlist=['embeddings'])
string = 'ems.' + emName.capitalize()
embedding = eval(string)(**embedding_config)

mds = __import__('models.%s' % modelName,
fromlist=['models'])
string = 'mds.' + modelName.capitalize()
model = eval(string)(L[embeddings])
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
if mode == 'train':
train = pd.read_csv('data/train.csv')
for i in range(20):
nloss = 0
for k in range(len(train)):
va = embedding.getem(train.iloc[k]['question'])
vb = embedding.getem(train.iloc[k]['answer'])
if train.iloc[k]['answer'] not in answerCache:
answerCache.append(train.iloc[k]['answer'])
trainTensor = model.prosess(va, vb)
output = model(trainTensor)
# 计算损失
predict = torch.tensor(train.iloc[k]['label']).float()
predict = predict.reshape([1, 1])
loss = criterion(output,
predict)
# 反向传播并更新权重
optimizer.zero_grad()
loss.backward()
optimizer.step()
nloss += loss
if k % 50 == 0:
print(i, k, 'done')
print('one loop done', nloss/len(train))
torch.save(model, 'models/%s.pth' % modelName)
if mode == 'test':
n = 0
model = torch.load('models/%s.pth' % modelName)
model.eval()
test = pd.read_csv('data/test.csv')
for i in range(len(test)):
va = embedding.getem(test.iloc[i]['question'])
vb = embedding.getem(test.iloc[i]['answer'])
testTensor = model.prosess(va, vb)
output = model(testTensor)
if output > 0.5 and test.iloc[i]['label'] == 1:
n += 1
if output < 0.5 and test.iloc[i]['label'] == 0:
n += 1
print(n/len(test))


if __name__ == '__main__':
if not len(sys.argv) == 4:
arg1 = 'cnn'
arg2 = 'dashscope'
arg3 = 'train'
else:
# 从命令行参数中获取参数值
arg1 = sys.argv[1]
arg2 = sys.argv[2]
arg3 = sys.argv[3]
main(model=arg1, embedding=arg2, mode=arg3)

+ 2
- 0
models/__init__.py Vedi File

@@ -0,0 +1,2 @@



BIN
models/cnn.pth Vedi File


+ 39
- 0
models/cnn.py Vedi File

@@ -0,0 +1,39 @@
from torch import nn
import torch


class Cnn(nn.Module):
def __init__(self, length):
self.length = length
super(Cnn, self).__init__()
self.conv1 = nn.Conv1d(1, 32, kernel_size=3, stride=1, padding=1)
self.relu1 = nn.ReLU()
self.pool1 = nn.MaxPool1d(2)
self.conv2 = nn.Conv1d(32, 64, kernel_size=3, stride=1, padding=1)
self.relu2 = nn.ReLU()
self.pool2 = nn.MaxPool1d(2)
self.conv3 = nn.Conv1d(64, 128, kernel_size=3, stride=1, padding=1)
self.relu3 = nn.ReLU()
self.pool3 = nn.MaxPool1d(2)
self.fc = nn.Linear(self.length * 32, 1)
self.sigmoid = nn.Sigmoid()

def forward(self, x):
x = self.conv1(x)
x = self.relu1(x)
x = self.pool1(x)
x = self.conv2(x)
x = self.relu2(x)
x = self.pool2(x)
x = self.conv3(x)
x = self.relu3(x)
x = self.pool3(x)
x = x.view(-1, self.length * 32)
x = self.fc(x)
x = self.sigmoid(x)
return x

def prosess(self, va, vb):
tensor = torch.Tensor([va, vb])
tensor = tensor.reshape([1, 1, len(va) + len(vb)])
return tensor

BIN
models/convkb.pth Vedi File


+ 31
- 0
models/convkb.py Vedi File

@@ -0,0 +1,31 @@
import torch
from torch import nn


class Convkb(nn.Module):
def __init__(self, length):
self.length = length
super(Convkb, self).__init__()
self.conv1 = nn.Conv1d(2, 1, kernel_size=1, stride=1, padding=0)
self.relu1 = nn.ReLU()
self.conv2 = nn.Conv1d(2, 1, kernel_size=1, stride=1, padding=0)
self.relu2 = nn.ReLU()
self.conv3 = nn.Conv1d(2, 1, kernel_size=1, stride=1, padding=0)
self.relu3 = nn.ReLU()
self.fc = nn.Linear(self.length * 3, 1)

def forward(self, x):
X1 = self.conv1(x)
X1 = self.relu1(X1)
X2 = self.conv2(x)
X2 = self.relu1(X2)
X3 = self.conv3(x)
X3 = self.relu1(X3)
X = torch.cat([X1, X2, X3], dim=2)
X = X.view(-1, self.length * 3)
X = self.fc(X)
return X

def prosess(self, va, vb):
tensor = torch.Tensor([va, vb]).reshape([1, 2, len(va)])
return tensor

BIN
models/doubletower.pth Vedi File


+ 62
- 0
models/doubletower.py Vedi File

@@ -0,0 +1,62 @@
from torch import nn
import torch


class Doubletower(nn.Module):
def __init__(self, length):
self.length = length
super(Doubletower, self).__init__()
self.conv1l = nn.Conv1d(1, 32, kernel_size=3, stride=1, padding=1)
self.relu1l = nn.ReLU()
self.pool1l = nn.MaxPool1d(2)
self.conv2l = nn.Conv1d(32, 64, kernel_size=3, stride=1, padding=1)
self.relu2l = nn.ReLU()
self.pool2l = nn.MaxPool1d(2)
self.conv3l = nn.Conv1d(64, 128, kernel_size=3, stride=1, padding=1)
self.relu3l = nn.ReLU()
self.pool3l = nn.MaxPool1d(2)
self.fcl = nn.Linear(self.length * 16, 256)
self.conv1r = nn.Conv1d(1, 32, kernel_size=3, stride=1, padding=1)
self.relu1r = nn.ReLU()
self.pool1r = nn.MaxPool1d(2)
self.conv2r = nn.Conv1d(32, 64, kernel_size=3, stride=1, padding=1)
self.relu2r = nn.ReLU()
self.pool2r = nn.MaxPool1d(2)
self.conv3r = nn.Conv1d(64, 128, kernel_size=3, stride=1, padding=1)
self.relu3r = nn.ReLU()
self.pool3r = nn.MaxPool1d(2)
self.fcr = nn.Linear(self.length * 16, 256)
self.sigmoid = nn.Sigmoid()

def forward(self, X):
x = self.conv1l(X[0])
x = self.relu1l(x)
x = self.pool1l(x)
x = self.conv2l(x)
x = self.relu2l(x)
x = self.pool2l(x)
x = self.conv3l(x)
x = self.relu3l(x)
x = self.pool3l(x)
x = x.view(-1, self.length * 16)
x = self.fcl(x)
x = self.sigmoid(x).reshape(256)
y = self.conv1r(X[1])
y = self.relu1r(y)
y = self.pool1r(y)
y = self.conv2r(y)
y = self.relu2r(y)
y = self.pool2r(y)
y = self.conv3r(y)
y = self.relu3r(y)
y = self.pool3r(y)
y = y.view(-1, self.length * 16)
y = self.fcr(y)
y = self.sigmoid(y).reshape(256)
X = torch.dot(x, y)
return X

def prosess(self, va, vb):
va = torch.Tensor(va).reshape([1, 1, len(va)])
vb = torch.Tensor(vb).reshape([1, 1, len(vb)])
return [va, vb]

+ 33
- 0
settings.ini Vedi File

@@ -0,0 +1,33 @@
[config]
source=sql
model=liandong
embedding=liandong
logger_path=/usr/share/knowledge/
usellm=0
[dashscopeembedding]
api_key=sk-44ccc9ab5e754eddb545cade12b632cf
[zhipuembedding]
api_key=e1c759ec620a9045360d7a90d697b88f.pjn1S2MqSS8lNmzj
[liandongembedding]
api_url=http://125.34.89.79:8000/index/embeddings
[essource]
api_url=http://8.140.53.237:9200
[sqlsource]
api_url=192.168.0.13:3308
api_id=root
api_password=Digimeta@123
[sparkllm]
api_url=ws://spark-api.xf-yun.com/v2.1/chat
domain=generalv2
app_id=948cf4b6
api_key=54f6e81f40a31d66d976496de895a7a4
api_secret=ZDYyMjNmMTlkYTE0YWRmOWUwZTYxNjYz
[baidullm]
access_url=https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=
api_key=TUuGVkpzzotFAhIIGIa0OCUO
api_secret=fv6LTCRcYhtxYb4Frs55jttOYICenCQG
api_url=https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/eb-instant?access_token=
[liandongllm]
api_url=http://125.34.89.79:8000/search/questionAnswer
[zhipullm]
api_key=e1c759ec620a9045360d7a90d697b88f.pjn1S2MqSS8lNmzj

Caricamento…
Annulla
Salva