PaLM
PaLM(Pathways Language Model)은 Google AI에서 개발한 5400억 개의 파라미터 변환기 기반 대규모 언어 모델이다.[1] 연구원들은 또한 모델 규모의 효과를 테스트하기 위해 더 작은 버전의 PaLM, 80억 및 620억 파라미터 모델을 훈련했다.[2]
PaLM은 상식 추론, 산술 추론, 농담 설명, 코드 생성 및 번역을 포함한 광범위한 작업을 수행할 수 있다.[2][3][4][5] 생각 사슬 프롬프트와 결합했을 때 PaLM은 단어 문제 및 논리 기반 질문과 같은 여러 단계의 추론이 필요한 데이터 세트에서 훨씬 더 나은 성능을 달성했다.[1][2]
이 모델은 2022년 4월에 처음 발표되었으며 구글이 PaLM 및 기타 여러 기술용 API를 출시한 2023년 3월까지 비공개로 유지되었다.[6] API는 대중에게 공개되기 전에 대기자 명단에 등록한 제한된 수의 개발자가 먼저 사용할 수 있다.[7]
구글과 딥마인드는 의료 데이터에 대해 미세 조정되고 의료 질문 응답 벤치마크에서 이전 모델을 능가하는 Med-PaLM이라는 PaLM 540B 버전을 개발했다.[8][9] Med-PaLM은 미국 의료 면허 문제에서 처음으로 합격 점수를 얻었으며 객관식 및 개방형 질문에 모두 정확하게 답하는 것 외에도 추론을 제공하고 자체 응답을 평가할 수 있다.[10]
구글은 또한 비전 변환기를 사용하여 PaLM을 확장하여 로봇 조작에 사용할 수 있는 최첨단 비전 언어 모델인 PaLM-E를 만들었다.[11][12] 이 모델은 재교육이나 미세 조정 없이 경쟁적으로 로봇 작업을 수행할 수 있다.[13]
2023년 5월 구글은 연례 구글 I/O 기조연설에서 PaLM 2를 발표했다.[14] PaLM 2는 3조 6천억 개의 토큰으로 학습된 3,400억 개의 파라미터 모델로 보고되었다.[15]
같이 보기
각주
- ↑ 가 나 Narang, Sharan; Chowdhery, Aakanksha. “Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance” (영어). 《ai.googleblog.com》. 2023년 3월 17일에 확인함.
- ↑ 가 나 다 Chowdhery, Aakanksha; Narang, Sharan; Devlin, Jacob 외 (2022). “PaLM: Scaling Language Modeling with Pathways”. arXiv:2204.02311 [cs.CL].
- ↑ Anadiotis, George (2022년 4월 12일). “Google sets the bar for AI language models with PaLM”. 《VentureBeat》. 2023년 3월 17일에 확인함.
- ↑ Bastian, Matthias (2022년 4월 5일). “Google PaLM: Giant language AI can explain jokes”. 《the decoder》. 2023년 3월 17일에 확인함.
- ↑ “Google: Why Is No One Talking About PaLM” (영어). 《seekingalpha.com》. 2022년 12월 12일. 2023년 3월 17일에 확인함.
- ↑ Vincent, James (2023년 3월 14일). “Google opens up its AI language model PaLM to challenge OpenAI and GPT-3”. 《The Verge》. 2023년 3월 17일에 확인함.
- ↑ Huffman, Scott; Woodward, Josh. “PaLM API & MakerSuite: an approachable way to start prototyping and building generative AI applications” (영어). 2023년 3월 17일에 확인함.
- ↑ Singhal, Karan; Azizi, Shekoofeh; Tu, Tao 외 (2022). “Large Language Models Encode Clinical Knowledge”. arXiv:2212.13138 [cs.CL].
- ↑ “MedPaLM: New Chatbots Will Soon Be Better Than Waiting For A Doctor”. 《The Medical Futurist》. 2023년 1월 17일. 2023년 3월 17일에 확인함.
- ↑ Matias, Yossi; Corrado, Greg (2023년 3월 14일). “Our latest health AI research updates” (미국 영어). 《Google》. 2023년 3월 17일에 확인함.
- ↑ Driess, Danny; Xia, Fei; Sajjadi, Mehdi S. M. 외 (2023). “PaLM-E: An Embodied Multimodal Language Model”. arXiv:2303.03378 [cs.LG].
- ↑ Driess, Danny; Florence, Pete. “PaLM-E: An embodied multimodal language model” (영어). 《ai.googleblog.com》. 2023년 3월 17일에 확인함.
- ↑ Edwards, Benj (2023년 3월 7일). “Google's PaLM-E is a generalist robot brain that takes commands” (미국 영어). 《Ars Technica》. 2023년 3월 17일에 확인함.
- ↑ Lardinois, Frederic (2023년 5월 10일). “Google launches PaLM 2, its next-gen large language model”. 《TechCrunch》. 2023년 5월 10일에 원본 문서에서 보존된 문서. 2023년 5월 10일에 확인함.
- ↑ Elias, Jennifer (2023년 5월 16일). “Google's newest A.I. model uses nearly five times more text data for training than its predecessor”. 《CNBC》. 2023년 5월 18일에 확인함.
- CS1 - 영어 인용 (en)
- 인용 오류 - 오래된 변수를 사용함
- CS1 - 미국 영어 인용 (en)
- 잘못된 파일 링크가 포함된 문서
- 위키데이터 속성 P18을 사용하는 문서
- 위키데이터 속성 P41을 사용하는 문서
- 위키데이터 속성 P94를 사용하는 문서
- 위키데이터 속성 P117을 사용하는 문서
- 위키데이터 속성 P154를 사용하는 문서
- 위키데이터 속성 P213을 사용하는 문서
- 위키데이터 속성 P227을 사용하는 문서
- 위키데이터 속성 P242를 사용하는 문서
- 위키데이터 속성 P244를 사용하는 문서
- 위키데이터 속성 P245를 사용하는 문서
- 위키데이터 속성 P268을 사용하는 문서
- 위키데이터 속성 P269를 사용하는 문서
- 위키데이터 속성 P271을 사용하는 문서
- 위키데이터 속성 P347을 사용하는 문서
- 위키데이터 속성 P349를 사용하는 문서
- 위키데이터 속성 P350을 사용하는 문서
- 위키데이터 속성 P373을 사용하는 문서
- 위키데이터 속성 P380을 사용하는 문서
- 위키데이터 속성 P396을 사용하는 문서
- 위키데이터 속성 P409를 사용하는 문서
- 위키데이터 속성 P428을 사용하는 문서
- 위키데이터 속성 P434를 사용하는 문서
- 위키데이터 속성 P435를 사용하는 문서
- 위키데이터 속성 P436을 사용하는 문서
- 위키데이터 속성 P454를 사용하는 문서
- 위키데이터 속성 P496을 사용하는 문서
- 위키데이터 속성 P549를 사용하는 문서
- 위키데이터 속성 P650을 사용하는 문서
- 위키데이터 속성 P651을 사용하는 문서
- 위키데이터 속성 P691을 사용하는 문서
- 위키데이터 속성 P716을 사용하는 문서
- 위키데이터 속성 P781을 사용하는 문서
- 위키데이터 속성 P791을 사용하는 문서
- 위키데이터 속성 P864를 사용하는 문서
- 위키데이터 속성 P865를 사용하는 문서
- 위키데이터 속성 P886을 사용하는 문서
- 위키데이터 속성 P902를 사용하는 문서
- 위키데이터 속성 P906을 사용하는 문서
- 위키데이터 속성 P947을 사용하는 문서
- 위키데이터 속성 P950을 사용하는 문서
- 위키데이터 속성 P966을 사용하는 문서
- 위키데이터 속성 P982를 사용하는 문서
- 위키데이터 속성 P1003을 사용하는 문서
- 위키데이터 속성 P1004를 사용하는 문서
- 위키데이터 속성 P1005를 사용하는 문서
- 위키데이터 속성 P1006을 사용하는 문서
- 위키데이터 속성 P1015를 사용하는 문서
- 위키데이터 속성 P1045를 사용하는 문서
- 위키데이터 속성 P1048을 사용하는 문서
- 위키데이터 속성 P1053을 사용하는 문서
- 위키데이터 속성 P1146을 사용하는 문서
- 위키데이터 속성 P1153을 사용하는 문서
- 위키데이터 속성 P1157을 사용하는 문서
- 위키데이터 속성 P1186을 사용하는 문서
- 위키데이터 속성 P1225를 사용하는 문서
- 위키데이터 속성 P1248을 사용하는 문서
- 위키데이터 속성 P1273을 사용하는 문서
- 위키데이터 속성 P1315를 사용하는 문서
- 위키데이터 속성 P1323을 사용하는 문서
- 위키데이터 속성 P1330을 사용하는 문서
- 위키데이터 속성 P1362를 사용하는 문서
- 위키데이터 속성 P1368을 사용하는 문서
- 위키데이터 속성 P1375를 사용하는 문서
- 위키데이터 속성 P1407을 사용하는 문서
- 위키데이터 속성 P1556을 사용하는 문서
- 위키데이터 속성 P1584를 사용하는 문서
- 위키데이터 속성 P1695를 사용하는 문서
- 위키데이터 속성 P1707을 사용하는 문서
- 위키데이터 속성 P1736을 사용하는 문서
- 위키데이터 속성 P1886을 사용하는 문서
- 위키데이터 속성 P1890을 사용하는 문서
- 위키데이터 속성 P1907을 사용하는 문서
- 위키데이터 속성 P1908을 사용하는 문서
- 위키데이터 속성 P1960을 사용하는 문서
- 위키데이터 속성 P1986을 사용하는 문서
- 위키데이터 속성 P2041을 사용하는 문서
- 위키데이터 속성 P2163을 사용하는 문서
- 위키데이터 속성 P2174를 사용하는 문서
- 위키데이터 속성 P2268을 사용하는 문서
- 위키데이터 속성 P2349를 사용하는 문서
- 위키데이터 속성 P2418을 사용하는 문서
- 위키데이터 속성 P2456을 사용하는 문서
- 위키데이터 속성 P2484를 사용하는 문서
- 위키데이터 속성 P2558을 사용하는 문서
- 위키데이터 속성 P2750을 사용하는 문서
- 위키데이터 속성 P2980을 사용하는 문서
- 위키데이터 속성 P3223을 사용하는 문서
- 위키데이터 속성 P3233을 사용하는 문서
- 위키데이터 속성 P3348을 사용하는 문서
- 위키데이터 속성 P3372를 사용하는 문서
- 위키데이터 속성 P3407을 사용하는 문서
- 위키데이터 속성 P3430을 사용하는 문서
- 위키데이터 속성 P3544를 사용하는 문서
- 위키데이터 속성 P3562를 사용하는 문서
- 위키데이터 속성 P3563을 사용하는 문서
- 위키데이터 속성 P3601을 사용하는 문서
- 위키데이터 속성 P3723을 사용하는 문서
- 위키데이터 속성 P3788을 사용하는 문서
- 위키데이터 속성 P3829를 사용하는 문서
- 위키데이터 속성 P3863을 사용하는 문서
- 위키데이터 속성 P3920을 사용하는 문서
- 위키데이터 속성 P3993을 사용하는 문서
- 위키데이터 속성 P4038을 사용하는 문서
- 위키데이터 속성 P4055를 사용하는 문서
- 위키데이터 속성 P4114를 사용하는 문서
- 위키데이터 속성 P4143을 사용하는 문서
- 위키데이터 속성 P4186을 사용하는 문서
- 위키데이터 속성 P4423을 사용하는 문서
- 위키데이터 속성 P4457을 사용하는 문서
- 위키데이터 속성 P4534를 사용하는 문서
- 위키데이터 속성 P4535를 사용하는 문서
- 위키데이터 속성 P4581을 사용하는 문서
- 위키데이터 속성 P4613을 사용하는 문서
- 위키데이터 속성 P4955를 사용하는 문서
- 위키데이터 속성 P5034를 사용하는 문서
- 위키데이터 속성 P5226을 사용하는 문서
- 위키데이터 속성 P5288을 사용하는 문서
- 위키데이터 속성 P5302를 사용하는 문서
- 위키데이터 속성 P5321을 사용하는 문서
- 위키데이터 속성 P5368을 사용하는 문서
- 위키데이터 속성 P5504를 사용하는 문서
- 위키데이터 속성 P5587을 사용하는 문서
- 위키데이터 속성 P5736을 사용하는 문서
- 위키데이터 속성 P5818을 사용하는 문서
- 위키데이터 속성 P6213을 사용하는 문서
- 위키데이터 속성 P6734를 사용하는 문서
- 위키데이터 속성 P6792를 사용하는 문서
- 위키데이터 속성 P6804를 사용하는 문서
- 위키데이터 속성 P6829를 사용하는 문서
- 위키데이터 속성 P7293을 사용하는 문서
- 위키데이터 속성 P7303을 사용하는 문서
- 위키데이터 속성 P7314를 사용하는 문서
- 위키데이터 속성 P7902를 사용하는 문서
- 위키데이터 속성 P8034를 사용하는 문서
- 위키데이터 속성 P8189를 사용하는 문서
- 위키데이터 속성 P8381을 사용하는 문서
- 위키데이터 속성 P8671을 사용하는 문서
- 위키데이터 속성 P8980을 사용하는 문서
- 위키데이터 속성 P9070을 사용하는 문서
- 위키데이터 속성 P9692를 사용하는 문서
- 위키데이터 속성 P9725를 사용하는 문서
- 위키데이터 속성 P9984를 사용하는 문서
- 위키데이터 속성 P10020을 사용하는 문서
- 위키데이터 속성 P10299를 사용하는 문서
- 위키데이터 속성 P10608을 사용하는 문서
- 위키데이터 속성 P10832를 사용하는 문서
- 위키데이터 속성 P11249를 사용하는 문서
- 위키데이터 속성 P11646을 사용하는 문서
- 위키데이터 속성 P11729를 사용하는 문서
- 위키데이터 속성 P12204를 사용하는 문서
- 위키데이터 속성 P12362를 사용하는 문서
- 위키데이터 속성 P12754를 사용하는 문서
- 위키데이터 속성 P13049를 사용하는 문서
- 구글의 소프트웨어
- 대형 언어 모델