목록Chatbot (13)
Head vs breakz
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bXAgAl/btqJbnY3y5b/UertR49fXHdbsutHXKypo1/img.jpg)
training data 데이터셋은 모두 영어로 된 것을 사용하였습니다. Pre-training으로는 많은 연구에서 사용된 Reddit를 사용하였습니다. subreddits의 경우는 다양한 주제를 다루기 떄문에 오픈-도메인으로 학습하는데 큰 도움이 됩니다. 데이터는 heuristic rule를 통해 필터링을 하였습니다. 그리고 총 9개의 조건 중 하나라도 충족되면 댓글과 하위 댓글을 삭제 시켰습니다. 1. 저자가 봇 인 경우 2. 영어가 아닌 경우 3. 댓글이 제거/삭제 된 경우 4. 띄어쓰기를 제외한 2048개의 문자 일 경우 5. 128 BPE tokens 보다 길 경우 6. 5개 문자보다 짧은 경우 7. URL를 포함한 경우 8. 시작이 non-ASCII 문자인 경우 9. 깊이가 7보다 더한 경우...
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bzRDFY/btqIMWBRnmk/EQXgdB1To9B0i9pebAiUqK/img.jpg)
2020년 4월 30일 , Recipes for building an open-domain chatbot의 논문이 arxiv에 나왔습니다. : ) arxiv.org/abs/2004.13637 Recipes for building an open-domain chatbot Building open-domain chatbots is a challenging area for machine learning research. While prior work has shown that scaling neural models in the number of parameters and the size of the data they are trained on gives improved results, we show that ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bXBmG0/btqInMMYPO4/vag30d1sf4gkWamRk7D06K/img.png)
1. 찾아보기 mwpt.mma.go.kr/mmachat/chatbot.do
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cluorL/btqGqQpsRB9/doaVxtbosnF3oRkpogskcK/img.jpg)
AI에 대한 관심은 끊임없이 증가하고 있고, 우리들 생활 속에 AI를 통한 서비스가 많이 등장하였습니다. AI를 통한 서비스는 쉽게 접할 수 있으며, 다양한 기능을 사용할 수 있습니다. 저는 AI를 이용한 서비스 중에서 챗봇에 대한 이야기를 하려고 합니다. 1. 챗봇이란? 챗봇(chatbot) 혹은 채터봇(Chatterbot)은 음성이나 문자를 통한 인간과의 대화를 통해서 특정한 작업을 수행하도록 제작된 컴퓨터 프로그램이다. 토크봇(talkbot), 채터박스(chatterbox) 혹은 그냥 봇(bot)라고도 한다. 인간이 사용하는 언어를 이해해서 대화를 진행하는 자연언어처리 기술을 심각하게 적용하는 언어이해 방식, 입력받은 말에서 특정 단어나 어구를 검출하여 그에 맞는 미리 준비된 응답을 출력하는 검색 ..