일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- zip 암호화
- 900gle
- MySQL
- matplotlib
- Kafka
- query
- Elasticsearch
- high level client
- 차트
- API
- aggregation
- zip 파일 암호화
- aggs
- sort
- docker
- Test
- flask
- license delete
- License
- Python
- plugin
- ELASTIC
- springboot
- TensorFlow
- 파이썬
- licence delete curl
- token filter test
- Java
- Mac
- analyzer test
- Today
- Total
개발잡부
[tensorflow 2] Text embedding A/B TEST - 2 본문
tensorflow embedding A/B 테스트
tensorflow embedding 모델을 2가지 방법으로 색인해서 테스트해 본다.
A : https://tfhub.dev/google/universal-sentence-encoder-multilingual-large/3"
B : https://tfhub.dev/google/universal-sentence-encoder-multilingual/3"
위의 두개를 테스트 해보았으나.. 뭐가 낫다고 판단 할 수가 없어 색인 방법으로 테스트를 다시 해 봄
모델은 라지 형님
#모델 API
https://tfhub.dev/google/universal-sentence-encoder-multilingual-large/3"
CASE A
상품명(name) 으로 vector 를 추출
name = [doc["name"] for doc in docs]
CASE B
상품명(name) 과 카테고리(category) 를 조합하여 vector 를 추출
name = [[doc["name"], doc["category"]] for doc in docs]
검색어 : 루이비통 여성
CASE A :
name: 루이 비통 모노그램 종크, category: 패션잡화 주얼리 팔찌 패션팔찌, score: 1.5737112
name: 루이 비통 삭 쾨르 M58738, category: 패션잡화 여성가방 숄더백, score: 1.5171634
name: 루이 비통 파시 M45592, category: 패션잡화 여성가방 숄더백, score: 1.4977398
CASE B :
name: 프라다 파니에 사피아노 스몰백 17 2ERX F0LJ4 1BA217, category: 패션잡화 여성가방 토트백, score: 1.5737112
name: 루이 비통 뉴 웨이브 체인 백 M58664, category: 패션잡화 여성가방 숄더백, score: 1.5171634
name: 루이 비통 네오노에 MM M45256, category: 패션잡화 여성가방 토트백, score: 1.4977398
검색어 : 롤렉스 시계
CASE A :
name: 롤렉스 남성 시계 126334G, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.7302626
name: 롤렉스 남성시계 116618LB, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.6464772
name: 롤렉스 데이저스트 69173 시계 26M 다이아10p, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.5828612
CASE B :
name: 유사나 바이오메가 530.5mg x 112캡슐, category: 식품 건강식품 영양제 오메가3, score: 1.659427
name: 해외561027236 특별 가격Omega De Ville Ladies Watch 42, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.646426
name: 오메가 여주점 레어팩토리 드 빌 프레스티지 쿼츠 424 23 27 60 52 001, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.646426
와.. 망.. 카테고리가 오히려 방해가 되네
B가 이긴다는 가정하에 작업을 했는데..
내가 뭘 잘못했나?
'Python > text embeddings' 카테고리의 다른 글
[tensorflow] word2vec 구현해보자 (0) | 2022.01.18 |
---|---|
[tensorflow 2] Text embedding API를 만들어 보자 (0) | 2022.01.15 |
[tensorflow 2] Text embedding A/B TEST - 1 (0) | 2022.01.14 |
[tensorflow 2]Universal-sentence-encoder-multilingual-large (0) | 2022.01.13 |
[tensorflow 2] sentence encoder A/B test (0) | 2022.01.12 |