라벨이 AI인 게시물 표시

추천 게시물

SmartStart AI - 중소기업을 위한 경제적인 AI 머쉰 개발 사업

이미지
5월 12일, "예비창업패키지 예비창업자 지원 사업"에 사업계획을 제출해, 서류 전형과 발표심사를 통과했다는 통보를 받았다. 창업자가 되려면 멀었고, 아직 '예정자'이다.  AI인데, 프로젝트명은  "NOTAL" - not AL, notAl이다. AI가 아니라고 주장하는 AI사업이다. 특정영역에서 사용할 수 있는 가성비 있는 sLM 머쉰을 만드는게 목표다. 중소기업이 쉽게 AI를 적용, 시작할 수 있게하는게 목표다. 그래서 AI를 중간에 두고, 앞과 뒤의 Legacy System에 '쉽게' 연결해 쓰고, 도입비용이 싸야한다. 1000만원대 ~ PoC를 하다보니 처음부터 1000만원은 좀 무리일 수 있겠다는 생각이 든다. Legacy System과 인터페이스를 하는데, 그것을 옆에서 도와주는데 시간이 꽤 들어간다. 1000만원 정도에 판매를 하고, 기본 지원 횟수가 넘어서면 교육비를 받던 해야할 것 같기도 하다. PoC에선 콜센터를 담당하는 팀장, 운영자가 n8n을 이용해 답변을 만들고 API로 대답에 들어갈 정보나 업무를 처리하는 방식으로 진행 중이다. RAG 형태의 Q&A 응답도 들어간다.  시간이 꽤 들어가는 이유는 개발조직-운영조직(콜센터) 간의 엇박자이다. 리듬과 템포가 맞아야하는데, 제3자가 어떻게 하기도 어렵다. 그래도 업무처리, AI 도입성과는 기대된다. 토/일요일 문의 대응도 잘 될 것 같다. PoC를 하면서 API 스펙 정의 가이드 를 만들었다. Client가 내부에서 협의해 API를 만들어야 하는데, 지켜보다 결국 회의 해 우리가 Sample을 만들었고, 나는 회의 내 이러면 안된다면 고객사의 '열의를 갖고' n8n에 프롬프팅을 하는 팀장에게 핀잔을 주며 빈둥댔다. 그리고, 몇 차례 회의 내용과 API Sample을 가지고 가이드 초안을 만들어 Notion에 올렸다.

AI 도입 지원을 위한 1000만원 이하 Voice & Text Gateway 개발, PoC 준비

이미지
어제는 개인적으로 중요한 날이다. AI를 깊게 하시는 분들이 보면 우스워보일 수도 있는 - 다들하는 "AI 머신"을 만들어 PoC(Proof of Concept)를 위해 업체 한 곳에 설치했다. 이 애의 이름은 "SmartStart AI"다. 기본 STT/TTS 머쉰이다. 이걸 만든 목적은 레거시 시스템을 건드리지않고, 낮은 비용으로 쉽게 AI를 해볼 수 있도록 도와주는 거다. 따라서 GPU는 젯슨 나노나 GPU 40XX 시리즈를 사용한다. 200만원대 하드웨어를 사용해 적정한 성능을 내는건데, 어제 설치한 것은 쿠팡에서 산 100만원이 조금 더 넘는 PC에 설치했다. 기존 시스템을 안건드리고(건드려도 최소한으로만), AI를 적용해 보고, 확장할 수 있게 하려다 보니 앞뒤로 인터페이를 할 Gateway들이 붙어있다. 앞에는 Communication G/W가 있고, 뒤에서는 Agent Ochestration G/W가 있어 텍스트화된 발화 의도를 파악해 적정한 AI Agent에게 업무를 할당해준다. 커뮤니케이션은 아날로그(옛날 집전화, PSTN)부터 인터콤, VoIP 이런 음성이 들어가는 장비들과 한다. 처음 만든 MVT(MVP)는 PC 내 마이크였다. 쉬운 예를 들면 ARS에서 특정번호를 누르면 "SmartStart AI"와 연결된다. 아니면 그냥 앱에서 Voice를 입력하면 보이스봇(챗봇)이 된다. 이 부분이 좀 어렵다. 유선통신은 너무 오래되고(100년전쯤?) 굳어진 기술이긴 한데, 신상(AI)과 어울리게 붙이는데 경험을 포함한 잔기술과 시간이 많이 들어간다. 세상에 음성이 입력되는 장비들을 생각해 보면 된다. 집안, 엘리베이터, 집밖 공동현관, 차량게이트 - 인터콤 계열, PSTN, VoIP, 핸드폰 - 전화 계열, 키오스크 같은 Stand Alone System들 ... 등등 Communication G/W는 결국 오픈소스 교환기를 가져다 이런 저런 장비들하고 인터페이스를 맞춰, 입출력 테스트까지 ...

AI 서비스 목록과 관심사

이미지
페친이 " 요즘 업무나 일상에 사용 중인 서비스들 목록.."이라면 이미지를 올렸다. 이름은 들어본게 반이 안된다. 정말 이걸 다쓴다고 ...  자주 쓰는 건 2~3개 정도. 뭐하는 건지 궁금해서 ChatGPT에 정리 요청. Claude는 AWS에서 프로젝트 준비하며 들어봤고, Perplexity는 한두번 쓰다가 말았고. Midjourney는 결과물들 구경을 했고 .. DeepseekR1은 설 연휴 듣고, sLM으로 사용해본다면 준비 중이라 아는 체하고 있고 .. MS Copilot Studio는 Mac을 쓰다보니 접할 기회가 거의 없고 ... 그런데 "A.에이닷"은 목록에서 빠졌네. 시대에 뛰떨어지긴 했지! AI라고 하기에는 ... A.은 Clova Note, ChatGPT 조합으로 가끔 쓴다. 임베디드/PC급 sLM 서비스를 기획하면서 요즘은 Agent 이야기를 많이 한다. RAG Agent API Agent RPA Agent  Browser Agent 그리고 Agent들에게 적합한 일을 시키는 Agent Orchestration Gateway. 특별한 Agent를 만드는게 아니라 특정 기능을 하는 Agent들과 sLM이 I/F하는 (서비스) 표준을 만드는 중이다. Legacy와 AI(sLM)을 쉽게 연결해 바로 AI를 사용해 볼 수 있도록 하려는 프로젝트 진행 중. 이중 Browser Agent에 대한 관심이 크다.  레거시시스템에서 AI가 화면을 조작해 바로 Data를 찾거나, 수정 등을 할 수 있기 때문에. 그러면 '보이는는 ARS'처럼 Voice 인터페이스와 화면 조작을 동시에 하면서 업무를 자동화하거나, 디지털 격차를 줄일 수 있지 않을까 생각 중. 브라우저 활용 AI 사람이 직접 웹을 탐색하지 않고 AI가 자동으로 필요한 작업을 수행하는 기술 가격 비교, 호텔 예약, 고객 응대 등 다양한 업무를 자동화 가능 대표적인 AI 솔루션: OpenAI Operator  (웹 자동화, 소비자 중심) Conve...