[AI/On-Device AI] 3대 빅테크 기업의 온디바이스 AI 전략

2024. 2. 1. 16:14·[ Artificial Intelligence ]/Trend

1. 온디바이스 AI 란 

= On-Device AI 

= 기기에 탑재된 인공지능

 

= 기존의 서버 기반 AI는 클라우드 서버에서

데이터를 수집 학습한 후 디바이스로 결과를 전송하는 방식이라

데이터 수집과 전송으로 인한 전력 소모가 크고

인터넷 연결이 어려운 경우 사용할 수 없다는 단점이 있으므로

간단한 AI는 디바이스 자체에 AI 연산을 수행할 수 있는 칩을 내장하여

통신 연결 없이 엣지단에서의 디바이스 컴퓨팅으로 동작시키려는 것

 

-> 장점 :

데이터 수집 전송시간 감소로 인한 저지연,  

데이터를 클라우드 서버에 전송하지 않으므로 개인정보 보호,

인터넷 연결이 불가능한 상황에서도 사용 가능한 안정

 

-> 클라우드 중심 AI에서 하이브리드 AI로 전환되며

Device, Edge Computing, Cloud 로 분화될 것으로 예측됨

 

 

2. 빅테크 기업의 온디바이스 AI 전략

온디바이스 AI는

디바이스 자체 하드웨어를 활용해 작업을 수행하므로

디바이스에 가속기를 더하여 구동의 효율성을 높일 수 있다

서버와의 통신 없이 전력 소모를 줄이며 AI 연산을 수행할 수 있으므로

인공신경망인 NPU(Neural Network Processing Unit 신경망 처리 장치) 칩이 중요한 역할을 한다

 

( 클라우드 기반의 기존 AI는 GPU (Graphics Processing Unit 그래픽 처리 장치)가 중요했음)

 

2-1. Apple - 오픈소스 개방 전략

애플이 공개한 논문과 툴킷

 

- 휴먼 가우시안 스플랫

(HUGS, Human Gaussian Splats)

동영상 속 인물과 배경을 분리하고 컨텐츠에 다시 활용하는 기술

50~100프레임 비디오만으로도 30분 이내에 움직이는 인간 아바타 생성 가능

 

- 제한된 메모리로 효율적인 대규모 언어 모델을 추론하는 법

(Efficient Large Language Model Inference with Limited Memory)

DRAM 용량의 제약이 있는 환경에서의 대규모 언어모델 작업을 위한 애플의 메모리 최적화 기술

추론 시간 4-5배 절약, 속도 20-25배 향상 가능 ( M1 맥스 CPU 환경 )

 

- MLX 

깃허브에 공개된 AI 개발 툴킷

애플 실리콘 M3 칩에서 실행 가능한 머신러닝용 데이터 어레이 프레임워크와 모델 라이브러리

연산 결과가 실제로 사용되기 전까지는 연산 작업을 최대한 미루는 방식인 lazy evaluation 을 사용

 

2-2. Google - Gemini

구글의 생성형 인공지능인 Gemini를 픽셀 스마트폰에 탑재하여

사용자의 개인정보가 클라우드에 전송되지 않도록 보호하고

AI 기능 기반으로 비디오 부스트, 야간 시야 비디오와

녹음 요약과 지보드 스마트 답장을 제공한다

 

2-3. MicroSoft - Bing 업그레이드 전략

지난 해에는 코파일럿에 집중하던 MS사가

이번에는 하드웨어쪽으로 더 진출하는 듯 하다

 

자체 검색 엔진인 Bing의 성능을 강화하여

윈도우 센트럴은 130억 개 파라미너를

네트워크 없이 구동 가능하도록 했고

새로 출시하는 서피스 프로와 서피스 랩탑에

코파일럿과 온디바이스 AI를 지원하도록 했다

 

728x90

'[ Artificial Intelligence ] > Trend' 카테고리의 다른 글

[AI/LLM] In-context learning  (0) 2024.11.22
[AI/GAN] GAN 적대적 생성 신경망의 개념  (1) 2024.01.21
[AI/Diffusion model] InstantID, 단일 이미지로 다양한 이미지 생성  (1) 2024.01.21
[AI/Vision] Apple의 AIM(대규모 비전 모델)  (1) 2024.01.21
'[ Artificial Intelligence ]/Trend' 카테고리의 다른 글
  • [AI/LLM] In-context learning
  • [AI/GAN] GAN 적대적 생성 신경망의 개념
  • [AI/Diffusion model] InstantID, 단일 이미지로 다양한 이미지 생성
  • [AI/Vision] Apple의 AIM(대규모 비전 모델)
dev charlotte
dev charlotte
주 - 컴퓨터공학 / 복수 - 산업 보안
    250x250
  • dev charlotte
    int main() {
    dev charlotte
  • 전체
    오늘
    어제
    • 분류 전체보기
      • [ Laboratory ]
        • Paper review
        • Advanced Operating System
        • System Software & Storage
        • Lab etc
      • [ Computer Science ]
        • Algorithm_C++
        • Operating System
        • Information Retrieval
        • Database_sql
        • SW Engineering
        • Computer Network
        • JavaScript
        • Python
        • Data Structure
        • CS study
        • Distributed systems
      • [ Computer Security ]
        • Convergence Security
        • Web Security
        • PIMS
        • Network Security
        • Digital Finance
      • [ Artificial Intelligence ]
        • Trend
        • Seminar
      • [ 미래, 같이, LG ]
      • [ Development ]
        • [ Front-end ]
        • [ Back-end ] Spring 기본
        • [ Back-end ] Node.js
      • etc
        • 현대오토에버 스마트 모빌리티 공학 체험 교육
      • It's me
  • 블로그 메뉴

    • 링크

      • GitHub
    • 공지사항

    • 인기 글

    • 태그

      프로그래머스 c++
      백준
      프로그래머스
      현대오토에버 스마트 모빌리티
      스마트모빌리티공학체험교육
      코딩 교육
      현대오토에버
      싸피 13기
      대학생 대외활동
      오블완
      티스토리챌린지
      소프트웨어 공학
      현대오토에버 스마트모빌리티
      비전공자 코딩
      공대생 대외활동
      SSAFY
      프로그래머스 코테
      코딩 인강
      SQL 쿼리
      SQL
      자바스크립트
      프로그래밍 언어론
      ssafy 13기
      hotstorage
      싸피
      데이터베이스
      MySQL
      spdk
      코드잇
      프로그래머스 입문
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.4
    dev charlotte
    [AI/On-Device AI] 3대 빅테크 기업의 온디바이스 AI 전략
    상단으로

    티스토리툴바