직접 써본 AI관련 툴즈 정리 및 총평 (#자동화#바이브코딩#노션#웹페이지제작#유튜브플리제작#전자책써보기#파이썬 등)
[가장 대중화된 생성형 AI들]
Gemini ⇒ 구글생태계기반, 각종 블로그나 사이트들에 대한 접근력이 가장 뛰어남.(이유는 구글 검색 인덱스에 연동되어있는 사이트들의 첫 페이지는 구글에서 접근가능하기 때문으로 보임), 문체나 리서치실력, 퍼포먼스는 가장 무난함, 개인적으로 같이 엮여있는 이미지생성AI모델인 나노바바나는 아직 갈 길이 멀다고 느낌
챗봇한정 아직까지는 대화형AI로서는 가장 무난하고 정보습득에 있어서도 다른 AI들보다는 강세인 것 같음. 풀어서 설명하는 능력도 다른 두 AI에 비해 우위
다만 약점은 시각화능력이 확실히 Claude에 비해서는 아직 약하다.
Claude나 GPT는 필요에 따라 그래프, 도표, 이미지 등 시각화 도움을 많이 주려고 하는 반면 Gemini는 텍스트로 커버(?)치려고 하는 느낌도 강하고 그래프를 요청하면 텍스트라인 그래프부터 선보이려고한다. 데이터 시각화 이미지를 따로 요청하면 만들어주긴 하지만 기본 디폴트값이 뭔가 텍스트위주인 것 같음
chatGPT⇒ GPT image 2.0으로 업그레이드되면서 현재 top3 AI들 중에서는 이미지생성능력은 최강이라고 볼 수 있다.
초기 GPT는 너무 감성적인 문체라고 비판을 많이 받았는데 오픈AI측에서 그것을 인지하고 좀 더 스콜라스러운 문체로 탈바꿈함.
시각화능력(이미지말고 도표, 그래프나 문서 등)은 Gemini보다는 뛰어나고 Claude보다는 못한 편. 하지만 시각자료 생성은 셋 중 가장 뛰어나다.
정보분석 능력은 Gemini가 일상적인 것을 포함하여 전체 분야에서 가장 무난한 답변을 내놓는다고 본다면 GPT는 특정 세부분야나 숫자를 다루는 분야에서 좀 더 강하며(물론 gemini도 고급추론에 쓰이는 pro가 있긴하다.) 가끔은 gemini와 claude로도 잡히지 않는 사각지대 정보같은 것을 알려주기도 한다. 정확도를 중시하는 편이다.
대화형이든 딥리서치기능이든 세 AI중에서는 가장 느리다. 물론 instant로 바꿔서 대답을 시키면 속도는 올라간다지만 claude의 opus 4.0이나 gemini의 flash(6월 기준으로 업그레이드된 flash)버젼에 비해서는 속도와 퀄리티 둘 다 잡진 못한다.
Claude ⇒ 기본적으로 claude chat, cowork, claude code 세 가지 탭이 있다.
chat은 챗봇형태이지만 앞서말한 두 AI와는 성격이 다르다.
모든 분야를 아우르는 정보수집기능은 셋 중 가장 떨어진다. 특히 투자자산운용사 시험을 준비할 때 세 AI중 가장 많은 오답을 자랑했다. 다만 Claude의 강점은 그게 아니다.
GPT와 Gemini가 대화형 백과사전내지는 특정분야 연구원이나 전문가 포지션에 가깝다면 Claude는 아주 일 잘하는 고급 비서에 가깝다. 아주 일 잘하고 똑 부러지는 비서가 있다치자. 이 비서가 모든 것에 정통할 필요는 없다.
다만 실제 살아숨쉬는 비서같이 리서치한 것을 문서화시키는 능력, 정리해주는 능력, 좀 더 사용자 니즈에 맞는 방식의 답변, 효율화(예를 들어 굳이 딥리서치가 필요한 주제에 대해서는 알아서 시간을 들이게 할 필요없이 스스로 그런 요청을 쳐내고 잘 답변해준다.)에 있어서는 다른 두 AI들과는 결이 다르다.
단점은 셋 중 이미지 생성능력은 가장 떨어진다. 일단 Cladue가 설명하기를 다른 두 AI보다는 텍스트위주로 강세를 띠지만 도표나 그래프, 배경을 제외한 이미지생성능력은 아직 약세를 띤다고 한다.
Cowork는 사용자 PC의 로컬환경에서 AI스킬을 써서 단순한 업무를 자동화시키는 툴이다. 클로드코드와 달리 무언가를 창조해내는 기능보다는 로컬환경을 포함하여 ‘해당 PC’에서의 업무를 대행하는 느낌이 강하다. 쉽게 말해 컴퓨터작업에 대한 접근권을 주고 그 작업을 대행해주는 것이다.
Claude code는 바이브코딩의 가장 선두주자라고 할 수 있다. 기존의 개발자언어로 코딩을 짜던 관습에서 이제는 우리가 말하는 언어, 즉 자연어로 AI에게 코딩을 짜게 해서 실행시키고 수정 및 보완까지 해내게하는 툴이다. VS studio나 Antigravity 등 터미널로 claude code를 연동시켜서 좀 더 좋은 환경에서 바이브코딩을 할수도 있다.
MCP(Model Context Protocol) 통해서 다른 프로그램이나 서비스에 대한 접근도를 높일 수도 있다.
Genspark => 앞의 세 개를 잘만 쓰면 사실 젠스파크를 쓸 필요가 있을까 싶은데 여러 AI모델들을 하나의 플랫폼에서 동시에 쓸 수 있다. 각각을 병렬작업시켜서 젠스파크가 종합해서 답변을 내놓는다.
또한 AI챗 기본기능말고도 워크플로우라고 하여 자동화기능을 어느 정도 구현해놓았다. 클로드 코워크와 바이브코딩 그 사이 지점이라고 보면된다. 젠스파크 스킬즈나 젠스파크 claw를 통해서는 좀 더 고급화된 AI agent 기능이나 자동화업무기능을 사용해볼 수 있다.
근데 간단한 자동화업무에도 크레딧이 너무 빨리 소모되는 편이다.
cf) AI를 활용해서 전자책 발행해보기 :
1) 개인도 판매자등록이 가능한 [유페이퍼] 사이트 회원가입
2) AI 통해서 제목, 부제목, 목차 선정할 것
3) [미리캔버스]란 사이트 활용하여 표지 및 첫페이지 이미지 채울 것
4) 본문작성은 폰트 크기 12pt로 작성하여 가독성 확보
5) 유페이퍼 전자책 업로드 방법 : 톱니바퀴아이콘클릭 -> 콘텐츠등록 -> 전자책등록
전자책제목, 저자명, 카테고리 등 기본 정보 입력 후 다음 단게 클릭
EPUB 파일 없을시 PDF 파일 업로드 -> ISBN, ECN 신청하면 3~4일 후 유페이퍼 등록 완료 (YES24나 알라딘은 문제없을시 5~7일 후 등록완료)
6) Calibere를 이용한 EPUB 파일 변환 :
변환할 PDF/Word 파일을 Calibre에 책 추가 -> 파일 선택 후 변환 버튼 클릭 -> 출력 형식을 EPUB으로 선택 -> 변환설정조정(메타데이터, 표지, 글꼴, 레이아웃, 전체 선택 후 '양쪽 정렬')
7) EPUB 유페이퍼 등록 체크리스트 :
목차나누기, 목차순서바꾸기, 표지 2장이면 1장 삭제, 양쪽 정렬 코드 삽입(HTML), 판권정보와 가격 책정 후 전자책 생성, ISBN / ECN 신청하기
(양쪽정렬 코드 예시 : <p class="calibre1" style="text-align: justify;"> )
[기획용, 업무용 AI들]
미드저니(Midjourney) => 디자인업계에는 원래 스테이블디퓨전이라는 독보적인 디자인 AI 모델이 있었다. 하지만 스테이블디퓨전은 진입장벽이나 구동방법이 다소 어렵다는 평이 많아서 지금의 디자인업계(+시각디자인에 관심있는 일반인들도)는 미드저니를 좀 더 선호한다고 알려져있다.
채팅하듯이 프롬프트만 입력해도 AI가 상당히 고퀄리티의 이미지를 추출해준다. 광고계에서 종사하고 있는 사람들 중 실제로 이 모델을 사용하는 사람이 적지 않다. 다만 그들은 본업답게 하나의 퀄리티있는 작업물을 뽑아내려면 몇 천장을 추출해야하고 당연히 그만큼 크레딧은 많이 쓰인다. 영상제작도 가능하고 다양한 화풍의 이미지나 창작물을 생성해낼 수 있다.
스테이블디퓨전은 본인 컴퓨터에 프로그램을 직접 설치해야해서 고성능 그래픽카드가 필수인데 미드저니는 자체 클라우드를 이용하기 때문에 여러 개의 작업창을 병렬로 띄워놓을 수도 있다.
노트북LM => 구글 생태계의 프로그램이면서 개인 연구 및 메모용 AI라고 보면 된다. 생성형 AI들이 외부채널을 통해서 수집한 정보들을 답변에 활용한다면 노트북 LM은 내가 제공한 리소스나 레퍼런스 내에서 그것들을 완벽히 간파하여 내가 필요한 물음에만 답해주거나 작업을 시행해준다고 이해하면 된다.
자료정리용으로 많이 쓰고 있으며 참조된 리소스나 레퍼런스를 기반으로 PPT 작업 등 부가적인 프레젠테이션 자료도 자체적으로 생성할 수 있는 툴을 갖고 있다.
감마(GAMMA) => 생성형(챗봇형) AI들이 만든 자료를 젠스파크나 노트북LM통해서 취합해서 하나의 아티클로 만들어보자. 그 후 감마를 통해서 작업을 하면 AI가 해당 아티클을 분석해서 하나의 피피티를 만들어주는데 지금이야 여러 AI들이 자체적으로 PPT 생성툴을 갖고 있는 경우가 많지만 초기에는 이 감마라는 AI가 PPT생성의 장인이었다.
옵시디언(Obsidian) => AI보다는 메모 프로그램에 더 가까운데 어떤 데이터들을 요약하고 서로 연관된 개념을 묶어서 연구해야하는 경우에 알맞다. 일종의 브레인스토밍st의 메모앱인데 노션이나 에버노트가 폴더 구조 기반의 트리형 메모앱이라면 옵시디언은 백링크(Backlink)를 활용한 네트워크형 메모앱이라는 차이점이 있다. 항목끼리 서로 거미줄처럼 연결되어 있고 다른 개발자들이 만든 플러그인으라는 것을 설치하면 좀 더 개성있는 커스텀화가 가능하다.
노션(Notion) => 노션은 이미 대중화가 되어있는 메모라이징 AI인데 기본적인 노션의 구조는 [블록, 페이지, 데이터베이스]이다.
블록은 노션의 가장 작은 단위, 페이지는 블록들을 담는 컨테이너이자 문서단위이다. 워크스페이스는 모든 페이지들을 관리하는 최상위공간, 즉 작업 환경이라고 보면 되며 개인용과 팀용 워크스페이스로 분리가 가능하다.
기능이 워낙 많아서 나도 아직 완벽히 숙지하고 있지는 않은데 데이터베이스 블록은 여러 개의 페이지를 한 곳에 모아 필요한 순간에 원하는 정보 혹은 원하는 형태로 골라 볼 수 있도록 한 블록이다. 블록을 담는 게 페이지이지만 그 페이지들을 데이터베이스 블록은 표형태로 담아낼수도 있다.
아래는 알고 있으면 좋은 기능 :
1. 컨트롤키를 누른채로 마우스좌클릭하면 [새탭에서 열기]가 가능하다.
2. 웹클리퍼라고 해서 이 확장프로그램을 작동시키면 드래그범위안의 모든 링크가 수집된다.
3. 노션AI기능은 일반 AI챗봇과 달리 내 워크스페이스내의 맥락을 이해하고 있는 AI이다. 즉, top3 AI들의 퍼포먼스를 빌리지만 그 맥락은 내 워크스페이스를 관통한다. 약간 노트북LM + 챗봇형 AI 느낌이기도 하다. 워크스페이스내에서는 클로드의 코워크처럼 자연어 명령으로 수정이나 조작이 가능하다. (예를 들면 페이지생성, DB 구축 등)
4. 노션 AI 호출 단축키 Ctrl + Shift + J
5. 노션 AI를 통해 해당 워크스페이스내 페이지의 요약이나 번역도 가능하다.
6. AI 속성[자동채우기]을 통해 데이터베이스 자료를 자동으로 그 속성에 맞게 분류해준다.
7. AI 노트 회의록은 회의 내용을 녹음하고 자동으로 전사(transcribe)해주는 블록이다.
회의 중 음성을 실시간으로 텍스트로 받아 적어 전사시키고 그것을 요약까지 해준다.
하지만 전체 회의 내용이 필요하다면 클로바가 낫다.
8. AI 블록으로 페이지 내용을 원하는 형식으로 재가공해주는 것도 가능하다. (/AI 입력 -> AI 블록 선택 -> 프롬프트 설정 후 참조할 소스페이지 선택 또는 @[멘션] 활용 -> 완료하기 -> 생성)
9. AI 이미지생성&편집기능으로 다이어그램, 차트, 슬라이드 등도 만들 수 있다. (페이지 맥락을 반영한 이미지 생성도 가능하고 기존 이미지도 AI로 수정 가능)
10. AI 에이전트는 단순한 AI 챗봇이 아니고 워크스페이스 맥락을 이해하고 직접 작업(액션)까지 수행할 수 있다. 결과물은 노션페이지에 직접 적용된다. 토큰을 써야하며 유료이다.
11. 즉각적인 메모라이징이나 AI 회의록 녹음이 가능하도록 위젯기능도 있다. (아이폰과 안드로이드가 약간 위젯 설정이 다름)
12. 노션 단축키 : 제목 1 #제목 2##제목 3###토글 리스트>체크박스[]글머리 기호*, -, 또는 +
번호 매기기1.구분선 연속 3번 입력 (---)
단축키 입력 후 스페이스바 누를 것
*글자* -> 글자 기울기사용
**글자** -> 글자 볼드체사용
[터미널, 바이브코딩 관련 프로그램]
안티그라비티(Antigravity) => 구글이 만들었거나 인수한걸로 알고 있다. 사진에서 보다시피 익스텐션(extension)을 통해 Claude code를 불러일으켜서 직접 터미널이란 개발자용 채팅툴(?)에서 작업을 할 수있게 해주는 프로그램이다. 안티그래비티의 좋은 점은 바이브코드를 활용해만든 결과물(ex. 웹페이지)를 따로 복사 붙여넣기 안해도 즉시 오른쪽탭에서 확인할 수 있다. 그럼 수정해야할 것들이 한 눈에 인식된다.
기본적으로 우리가 메모장을 .txt라고 쓰듯이 개발자들이 쓰는 메모장이자 AI가 읽을 명령어텍스트 양식을 .md(마크다운)라고 부른다. 즉, 워크스페이스를 지정해서 거기서 Antigravity.md를 만들고 그 md안에 프롬프트나 규칙을 넣는거라고 보면 된다.
Statusline (터미널하단에 상태바표시)도 킬 수 있다.
cf) 유튜브 플레이리스트 자동화 :
1) 만들고 싶은 플레이리스트의 컨셉을 md파일로 정리할 것(md파일이 일종의 기획서임)
2) claude cli 열어서 개발, 막히면 스크린샷(ALT+V으로 drop)으로 claude cli에 문제해결요구
3) 관리사이트를 생성했다면 그것을 토대로 개선해나갈 것
예시 : https://app-xi-plum-90.vercel.app/
VS code (Visual Studio code) => 마이크로소트가 만들었다. 안티그래비티와 유사하다.
기본적으로 내가 알고 있기로는 cmd와 powershell에 직접 입력하는 방법에서 이렇게 코드에디터 프로그램이 출시되고 또 바이브코딩이 대중화되면서 여기서 Claude code나 codex 등을 불러일으켜서 개발을 한다고 보면 되는데 VS code나 안티그래비티나 일종의 작업환경이라고 보면 된다. 결국 우리는 클로드코드나 코덱스같은 것의 도움을 받아야 바이브코딩이 가능하기에.
Github (깃헙) => Git이라는 코드를 온라인에 저장하고 공유할 수 있는 클라우드 저장소 플랫폼.
코드작업한 것을 인터넷에 올리는 용도이다. 어디서든 접근할 수 있고 다른 사람과 함께 작업하는 것도 가능하다.
깃헙 데스크탑을 통해서 PC내 Git들을 관리할 수 있다.
cf) 웹사이트배포하기 :
1) 깃헙에 들어가서 repository(레포지토리) 생성한다.
2) [깃헙데스크탑]이란 프로그램으로, 생성된 레포지토리를 다운로드한다.
3) VS code 또는 안티그래비티로 방금 만든 폴더 경로를 확인해서 연다. (윈도우 단축키 Ctrl + K + O)
4) Extention 통해서 AI agent(ex. Gemini Cli, Claude Cli 설치) 설치할 것
5) Node.js 다운로드 및 설치
6) 프롬프트 입력 (Next.js 사용해서 ㅇㅇㅇㅇ 웹사이트 만들어줘. DB없이 한 페이지로 된 사이트야.) 7) 파일들 생성되었으면 깃헛데스크탑프로그램으로 깃헙에 업로드(commit)
8) Publish branch -> 배포는 Vercel과 깃헙을 연동할 것 -> Vercl에서 새로운 프로젝트 생성 -> add GihHub Account 및 서비스배포 -> 작업한 레포지토리 찾아서 import 버튼 클릭 -> Next.js로 설정 후 Deploly(배포) 클릭
Next.js (넥스트제이에스) => 웹 애플리케이션을 쉽고 빠르게 만들 수 있도록 도와주는 웹 개발 프레임워크다. 우리가 바이브코딩을 통해 무언가 작업물을 만들면 심심찮게 볼 수 있는 확장자파일이다.
일종의 웹페이지 형식을 본딴 키트라고 보면 된다.
Node.js (노드제이에스) => 자바스크립트를 웹 브라우저 밖에서도 실행할 수 있게 해주는 실행환경이다. 자바스크립트란 웹브라우저 안에서만 동작하는 언어인데 노드제이에스를 통해 웹브라우저밖에서도 작동하게 한다.
Vercel (버셀) => Next.js로 만든 웹서비스를 인터넷에 배포하고 운영할 수 있게 해주는 클라우드 플랫폼이다. 그냥 웹사이트를 배포하기 위한 필수플랫폼 중 하나라고 보면 된다.
[파이썬 관련]
(사진은 추후에 넣을 것)
파이썬(Python) => 개발자들이 프로그래밍을 하는데에는 다양한 언어들이 있다.
그 가운데 파이썬이 초심자에게 채택받는 이유는 프로그래밍 문법이 비교적 단순하고 직관적이기 때문이다. 데이터분석을 포함하여 인공지능, 자동화, 웹 개발 등 각 종 IT분야에서 널리 쓰이며 AI시대가 도래했지만 좀 전문적으로 무언가를 제작해보려면 사람이 아직까지는 중간중간에 확인이나 검수는 해주는 과정이 필요하다.
물론 바이브코딩이 지금보다 더 발전하겠지만 적어도 코드를 읽고 어느 지점에서 변수나 오류가 발생했는지를 잡아낼 수 있는 기초문법을 안다면 코딩을 좀 더 수월하게 할 수 있을 것이다.
Colab => Colab(코랩)은 구글이 제공하는 클라우드 기반 파이썬 실행 환경이다.
Pandas => Pandas는 데이터 처리 라이브러리이다.
matplotlib => 시각화(그래프, 원차트 등)에 능한 대표적인 라이브러리이다.
Seaborn => matplotlib 기반의 좀 더 세밀화된 데이터 시각화 라이브러리이다. 좀 더 보기 좋고 세련된 그래프를 제공해준다는 평이 많다. 그리고 통계적 관계(correlation)를 표현할 수 있다는 강점이 있다.
import(불러오기)할 때 코드는 아래와 같다.
import seaborn as sns
Django => 파이썬으로 구동하는 풀스택 웹 프레임워크
Folium => Folium은 지도 위에 데이터를 시각화할 수 있게 해주는 지도 시각화 라이브러리이다.
특정 위치에 마커를 표시하거나 지역별 데이터를 지도 위에 표현하거나 이동 경로를 나타내거나 등의 작업에 사용된다.
특정 위치에 마커를 표시하거나, 지역별 데이터를 지도 위에 표현하거나, 이동 경로를 나타내는 작업 등에 사용됩니다.EDA => Exploratory Data Analysis의 약자로 한국어로는 탐색적 데이터 분석이라고 부른다.
본격적인 모델링에 앞서 사람이 직접 먼저 데이터를 살펴보며 구조와 특징을 파악하는 것이다.
결측치(missing value; 오류 등으로 누락된 값)와 이상치(outlier;극단적으로 표본 분포에서 크거나 작은 값) 등을 체크한다.
댓글
댓글 쓰기