일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- aggs
- Kafka
- licence delete curl
- Elasticsearch
- 차트
- ELASTIC
- springboot
- Test
- docker
- API
- token filter test
- Mac
- plugin
- Python
- matplotlib
- query
- license delete
- flask
- sort
- License
- zip 암호화
- MySQL
- TensorFlow
- aggregation
- Java
- analyzer test
- 파이썬
- zip 파일 암호화
- high level client
- 900gle
Archives
- Today
- Total
개발잡부
[python] test dataset (json) 파일 만들기 본문
반응형
데이터 셋으로 활용할 test 데이터를 만들어 보자
원천데이터는 900gle shopping 의 데이터를 활용.
create_dataset.py
# -*- coding: utf-8 -*-
import json
from elasticsearch import Elasticsearch
def create():
script_query = {
"match_all": {}
}
response = client.search(
index=INDEX_NAME,
body={
"size": SEARCH_SIZE,
"query": script_query,
"_source": ["name"]
}
)
es_data = []
for hit in response["hits"]["hits"]:
row = dict(name=str(hit["_source"]["name"]))
es_data.append(row)
f = open("similarity_data.json", 'w', encoding='utf-8')
f.write(json.dumps(es_data, ensure_ascii=False))
f.close()
if __name__ == '__main__':
INDEX_NAME = "goods"
SEARCH_SIZE = 10
client = Elasticsearch(http_auth=('elastic', 'dlengus'))
create()
print("Done.")
결과 물
similarity_data.json
[
{
'name': '고야드 플로트 백 숄더 쁘띠 플로 버킷백 PETIT 스페셜-그레이'
},
{
'name': '고야드 쁘띠플로 버킷백 PETITFLOT 스페셜 03098 10237403'
},
{
'name': '해외고야드 방돔백 패브릭 스트랩 VENDOME BAG 기본컬러 블랙브라운 VENDOMEBAGFABRI'
},
{
'name': '고야드 알핀 알팡 미니 백팩 스폐셜 컬러'
},
{
'name': '고야드 보잉 25 클러치 파우치 전'
},
{
'name': '고야드 클러치 세나 PM 스페셜-레드'
},
{
'name': '명품가죽끈 뉴고야드-엠보카멜 카멜 Q-H805'
},
{
'name': '고야드 세나 클러치 MGM SENAT 스페셜 03446 10237202'
},
{
'name': '고야드 AURA-J 클러치 몬테카를로 PM'
},
{
'name': '고야드 세나 클러치 Green'
}
]
반응형
'Python' 카테고리의 다른 글
[python] float check (2) | 2022.10.06 |
---|---|
[python] random number (0) | 2022.07.03 |
[python] numpy upgrade (0) | 2022.06.21 |
[python] 설치된 Package 확인 (0) | 2022.06.20 |
[python] csv 파일 읽어서 sql insert 문 생성 (0) | 2022.05.26 |
Comments