openAI GPT4 Vision 시각정보 API 사용해보기 > 개발관련
개발관련

openAI GPT4 Vision 시각정보 API 사용해보기

조회 533회 댓글 0건

앞으로 3년만 지나도 참 많은 것이 변해 있을것 같습니다.

지금도 GPT4는 쓸만 합니다. 3.5 버전 까진 사실 뭐 그렇구나. 글은 좀 쓰는 구나 그런데 4버전은 간단한 함수 같은 것은 뚝딱 입니다.


GPT4에 눈을 달아준 비전 브리뷰를 API를 통해서 사용해 보았습니다.

사진 정보 이용 할 때는 빠른 처리를 위해서 해주는 것이 있는데 여기서도 그렇습니다. 그렇기 때문에 사용하실 분은 어떻게 축소 되는지 설명이 있으니 반드시 읽어 보셔야 합니다.


아래 curl 사용하여 잘 되는지 테스트하기 쉬운 예 입니다.

그리고 예제를 복사해 올때 어퍼스트로피 같은것이 문제가 되는 경우가 있으니 특수문자가 될만한것이 질문에 포함되어 있다면 자세히 보시고 뺀 다음 테스트해 보시면 됩니다.



  # 한글이 들어가면 utf8로 넣어줘야 합니다.
  #   - 아래 openAI 에서 발급 받은 API키는 본인것을 넣어 주면 됩니다.
  #   - 한글로 물어보면 결과가 한글로 나오는데 쉘에선 인코딩 된것으로 리턴 받는다.
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer API키" \
    -d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'
 


vscode에 있는것 긁어서 붙였더니 짤리네요. 위에 데이터에 해당하는 부분입니다.

-d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'


그리고 위 예제는 첨부된 링크 타고 들어가면 "빠른시작" 부분에 있는 예제 입니다. 

거기서 curl 선택하면 나오는것에 몇 글자만 변경한 것입니다.




  # 위 쉘에서 받은것 한글 확인해야 하고자 할때는 아래 처럼 디코딩 하여 확인 하면 한글을 볼 수 있다.
  // \ub9cc\uc57d \uc6f9 형태로 나오는 것은 아래 함수를 사용하면 한글 utf-8로 나온다.
  $data = '...';
  $aJson = json_decode($data, true);
  print_r($aJson); exit;  
 


아래는 이번에 새로나온 달리3를 한글로 말했더니 아래것을 보여주네요


3a431b4e617b1cc09be8a09a9296fb78_1700282005_0459.png
 

왜 무섭게? 생긴놈이 나왔지!! 물론 3개는 이것과는 완전 다릅니다. 

앞으로 왠만한것은 틀에 잘 맞춰서 자동으로 해주는것이 많을듯. 글씨 못써도 컴퓨터 워드프로세스 쓰면 틀만 잘 맞추면 누가 작성한 문서이든 별 차이 없는것 처럼.


● 참고자료

  - PHP사용시 API 사용에 필요한 부분 정리된것


 



  • 페이스북으로 공유
  • 트위터로  공유
  • 구글플러스로 공유
전체 193건 1 페이지
  • profile_image 결론부터 말하면 vscode를 수정해서 만든것이 커서ai 이기 때문에 cursor ai 프로그램에서 vscode 확장 프로그램 사용하면 됩니다.최근에는 브라우저 설치하면 북마크 가져오는것 처럼 import 하는 기능이 있으니 커서ai 설치하면서 vscode 확장 프로그램 설치 된것 자동 설치 되는것 선택하면 됩니다.하지만 설정등 몇가지에 대해서는 직접해줘야 합니다.예를 들면 setting.json의 것은 가져오지만 스니핏은 가져오지 않았습니다. 그렇기 때문에 vsocde 오래 사용하면서 설정된것이 많다면 혹시 빼먹수 있는것이 있으니 vscode는 삭제 하지 않는것이 좋을듯 합니다. 하는일이 프로젝트를 자주생성하거나 문서…
  • profile_image 비용이 문제네요.요즘 유심 문제 때문에 복제폰 만들 수 있다는 것과 나 하고는 통신사가 달라 관계 없지만메일은 좀 신경이 쓰입니다. 그래서 알아 봤는데 비용이 문제네요.하지만 생각해보면 별 다른 방법이 없습니다. 비용 처리 하고 안전하게 사용할것이냐 아니면 주의해서 사용할것이냐의 문제일듯 싶습니다.사진, 지문, 주민번호등 민감정보가 많이 있다고해 확인해 방문해서 보게 되었는데 제가 처음 보는 사이트여서 전 여기 가입한 적은 없는듯!!약간의 여유가 있다면 비용을 지불하는 것이 좋다고 봅니다. 왜냐하면 더 큰 비용이 지출 될 수 있기 때문에 그런데요 우리가 보험을 드는 이유와 같다고 보면 될것 같습니다.나 개인이 아니라 연…
  • profile_image 웹사이트를 운영하기 전에 첫번째로 해야 하는것이 도메인 등록입니다. 숫자로된 IP 주소는 외우기도 힘들뿐만 아니라 서버가 이전되어 IP주소가 변경되거나 또는 여러개의 웹사이트를 운영하기 위해서 가상호스트를 설정하거나 하게 되면 도메인은 필수 입니다.네임서버의 역활은 도메인(영문 또는 한글)을 IP주소를 반환해 주는 역활을 합니다.도메인을 먼저 등록해야 네임서버를 사용할 수 있습니다.아래는 오랬만에 도메인 등록하기 위해서 이전에 사용하던 업체에서 등록 하려 했는데 가격이 이 가격이었나? 아닌것 같은데???해서 찾아본곳입니다. 도메인 등록할때는 중요한것이 연장을 했을 때 비용이 늘어나면 안됩니다.위 "도메인비용"은 변경 되…
  • profile_image 예전에 도메인 등록이라고 되어 있었는데 현재는 스마트워크를 통해서 등록을 해야 되네요.순서만 알면 되는데요. 대략 다음과 같습니다.● phpMailer 통해 메일 발송시  - POP3/IMAP 허용을 해줘야 하며 발송 비밀번호는 카카오 앱생성할때 자동으로 생성됨 ● 개인 도메인 연결1) 다음메일 메뉴에 "스마트워크"라고 있습니다. 클릭 후 하란대로 하고 나면2) 네임서버에 MX 레코드 추가하라고 합니다. 그럼 추가를 해주고 나면 일정 시간이 되면 자동으로 처리 해 줍니다.        MX 서버주소     우선순위          ASPMX.daum.net.     10    ALT.ASPMX.daum.net.     …
  • profile_image 프로그램을 하다 보면 블럭을 설정해야 되는 경우가 있습니다.그런 경우 유용한 프로그램 입니다.전 : 또는 = 정렬이 필요한 경우가 있는데 유용하게 사용하고 있습니다.Align Text Tokens 이 프로그램은 선택한 줄 내에서 특정 텍스트 토큰을 정렬할 수 있도록 합니다 ● Align Text Tokens 사용 방법1) 마우스로 블럭을 설정 합니다.2) F1 키를 클릭 후  Align Text Tokens 를 찾습니다.3) 어떤 기호를 정렬할지 입력해주고 엔터를 칩니다.그다음 블럭설정등 하여 한꺼번에 수정 해야 되는 작업을 하면 됩니다.가변길이 폰트는 비뚤빼둘해서 이런것에는 좋지 않아서 보기 좋지 않아도 고정길이 폰트…
  • profile_image 마소의 원격관리 프로그램의 이름은 Microsoft Garage Mouse without Borders 입니다.구글에서 이렇게 검색을 해서 받아 사용하면 됩니다.장점은 다른 무료 프로그램과 다르게 클립보드 같은것 잘 됩니다.개인의 경우 단점은 아닐 수도 있으나 3대까지만 됩니다.4대라고 말을 하는곳이 있는데 그것은 자신 로컬까지 포함 4대이고 원격으로 가능한 숫자는 3대가 맞습니다.좋은 점은 직접 마우스키보드 설치를 하지 않아도 되지만 초기 한번은 해줘야겠지요다만 직접 앞에가서 하지 않아도 되는 부분만 다릅니다.이건 물리적으로 만들어진 것이 아니라 프로그램 설치만 하면 되며 물리적으로 관리를 하고 싶으면 스위치 장비나 …
  • profile_image 요즘은 호환을 위해서 만들때 기존에 잘 나가는 회사의 API와 동일하게 만들어서 엔드포인트와 api 키 정도면 변경하면 바로 사용할 수 있게 만들고 있는 추세 입니다.트위터의 후신인 X 에서 생성형AI를 만들었는데 사용 방법이 그렇습니다. import java.io.BufferedReader;import java.io.InputStreamReader;import java.net.HttpURLConnection;import java.net.URL;import java.nio.charset.StandardCharsets;import java.util.HashMap;import java.util.Map;import org.j…