오늘 소개해드릴 뉴스는 합성데이터 스타트업 '그레텔'에 관한 소식입니다. 그레텔이 어마어마한 규모의 '텍스트-SQL' 데이터셋을 오픈 소스로 공개했다고 합니다. 무려 100개 분야에서 10만개가 넘는 샘플로 이루어진 데이터셋이라고 합니다. 게다가 아파치 2.0 라이선스로 제공되어 상업적 이용도 무료로 할 수 있습니다. 다양한 분야의 AI 모델 학습에 두루 활용될 수 있겠죠.
혹시 텍스트-SQL이 뭔지 궁금하신가요? 간단히 말씀드리면, 우리가 일상어로 데이터베이스에 물어보면 원하는 정보를 찾아주는 기술입니다. "이런저런 조건의 데이터를 가격순으로 정렬해줘~"라고 요청하면 복잡한 SQL 쿼리를 직접 작성할 필요 없이 손쉽게 DB를 핸들링할 수 있게 해줍니다. 텍스트-SQL 데이터로 대형 언어 모델(LLM)을 학습시키면 데이터베이스용 자연어 인터페이스 개발도 가능해집니다.
하지만 고품질 텍스트-SQL 데이터셋을 만드는 건 결코 쉬운 일이 아닙니다. 지금까지는 사람이 수작업으로 만들어야 해서 많은 시간과 비용이 들었거든요. 상업적 활용에도 라이선스 제한이 있어서 불편한 점이 많았죠.
그런데 그레텔이 자체 개발한 AI 시스템 '네비게이터'를 이용해 고품질 텍스트-SQL 데이터를 자동으로 합성해냈다고 합니다. 심지어 GPT-4로 품질 평가까지 해보니 기존 데이터셋보다 표준 준수율이나 정확도 면에서 더 우수한 성능을 보였다네요.
그레텔 수석 과학자는 양질의 학습 데이터 확보가 생성형 AI 개발의 가장 큰 장애물 중 하나였는데, 이런 식의 고품질 합성 데이터가 그 격차를 메워줄 수 있을 거라고 말합니다. 또한 그레텔의 솔루션은 엔터프라이즈 차원에서 데이터를 생성하고 보강하는 데에도 도움이 될 거라고 하네요.
그레텔이 이번에 공개한 대규모 텍스트-SQL 데이터셋 덕분에 각종 분야에서 AI 모델을 학습시키는 것이 한결 용이해질 것 같습니다. 나아가 데이터 기반 혁신에도 더욱 속도가 붙을 것으로 기대됩니다. 멀지 않은 미래에 우리가 자연어로 DB를 자유자재로 다루게 될 날이 오지 않을까요? 정말 기대가 됩니다!
너무나도 중요한 소식 블로그 (클릭)
너무나도 중요한 소식 ebook (클릭)
1. 네이버 카페 '실전주식투자연구소' 로 오시면, 본 블로그의 모든 내용을 카테고리별로 정렬하여 순서대로 확인하실 수 있고, 다양한 실전 투자 정보도 얻을 수 있습니다~
2. 자타가 공인하는 주식 단기 시스템 트레이딩의 최고 전략가, '닥터 퀀트의 단기 트레이딩 강좌'가 뉴지스탁에서 진행중입니다. 닥터 퀀트의 강좌에서는 그동안 공개하지 않았던 무려 50개 이상의 실전 트레이딩 전략과 주기적인 업데이트 강의가 제공됩니다~
3. 'systrader79의 단기 시스템 트레이딩 강의' 와 '팩터 백과 사전 강의' 가 뉴지스탁에서 진행중입니다~ 주식 단기 트레이딩과 자산 배분 전략에 관심이 있으신 분들의 많은 성원 부탁드립니다
4. 여러분의 인생이 걸린 너무나도 중요한 소식 ----> 여기를 클릭하세요!
'유용한 정보' 카테고리의 다른 글
키움증권 영웅문 S 글로벌 다운로드 (0) | 2024.04.14 |
---|---|
단타 스캘핑을 하시려면 일단 호가창에서 이걸 보셔야 합니다. (0) | 2024.04.12 |
초단타 고수 과정 3년 단축 방법 (0) | 2024.04.12 |
메타 "AGI 도약 방법 발견...'트랜스포머'와 다른 아키텍처 개발 중" (0) | 2024.04.10 |
유튜브 프리미엄 월 1만원 할인받고 월 4000원에 이용하는 방법 (1) | 2024.04.08 |
ChatGPT-4? Claude3 로 갈아타세요! (1) | 2024.03.29 |
나는 주식으로 월급 두 번 받는다 (4) | 2024.01.31 |
systrader79 신간 - 돌파 매매 전략 (4) | 2023.12.21 |
댓글