일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- ELASTIC
- high level client
- sort
- aggs
- Test
- Elasticsearch
- query
- licence delete curl
- aggregation
- license delete
- zip 암호화
- Python
- docker
- springboot
- flask
- API
- TensorFlow
- 차트
- MySQL
- plugin
- License
- 900gle
- zip 파일 암호화
- analyzer test
- token filter test
- matplotlib
- Mac
- Kafka
- 파이썬
- Java
Archives
- Today
- Total
목록2025/03 (1)
개발잡부

외래어 추출.. 을 하라고 한다..애매하다..로그에서 외래어라고 판단하는건 사람이 해야 하는데.. 추출을 하면 그게 또 근거를 제시해야 하는..아무튼.. 생각해낸 방법은 한국어 어문규범 여기에 등록된 67,184개의 외래어를 이용했다. 일단 이걸 색인으로 만들었다. 시간이 없어서 지피티 선생님을 활용해 인덱스 생성 쿼리를 급하게 만들고색인쿼리도 급 제작 최근 검색어 최근 1주일(3/13 ~ 3/20)최근검색어 (실패검색어로 변경) 에서 상위 30,000개 추출추출된 검색어와 외래어를 비교하여 추출 (추출기준 하단 참고)공백없이 한단어로 이루어진 단어 (5,322개)추출된 외래어와 편집거리 1에서 비슷한 단어 검색로그에서 추출 (유입수 10 이상)작업자의 판단으로 진행여부 결정 (약 250개 예상..
카테고리 없음
2025. 3. 26. 08:24