본문 바로가기

리뷰/컨퍼런스, 세미나 등 리뷰

[컨퍼런스] AWS Innovate AI/ML Edition (2022/02/24)

728x90

오늘은 AWS Innovate AI/ML Edition 컨퍼런스 리뷰를 작성하고자 한다.

무료 온라인 컨퍼런스고, 강연 영상도 다 올라와있다.

AWS Innovate - 기계 학습 및 AI 에디션 (amazon.com)

 

AWS Innovate - 기계 학습 및 AI 에디션

기조연설 비즈니스 혁신 가속화를 위한 클라우드 기반 인공지능 역량 강화하기 (레벨 100) 인공지능과 기계 학습(AI/ML) 능력은 새로운 비즈니스 개발과 매출 증대에 중요한 역할을 하고 있습니

aws.amazon.com

 

AI/ML 주제로 진행된 컨퍼런스고, 컨퍼런스 일정 지나고 올라와 있는 강연을 통해 들어보았다. 아래의 4개의 강연을 들었고 각각에 대해 간단히 리뷰를 작성하고자 한다.

  • From PoC to Production: 기계 학습을 조직 내 정착시키기 위한 전략
  • 기계 학습 전문지식 없이 Amazon Personalize 에서 맞춤형 추천 기능 개발하기
  • 동화기업, Smart Factory 데이터 분석 사례
  • 지능형 검색 서비스인 Amazon Kendra 통해 자연어 검색으로 원하는 답변을 빠르고 정확하게 얻어보기

AWS 서비스에 대한 소개가 전반적으로 깔려있었지만 흥미있게 들을 수 있었다. 최근 AI/ML 도입을 쉽게 할 수 있는 서비스들이 다양하게 출시되고 있고 실제로 많이 사용하고 있다는 것을 파악할 수 있었다. 4차 산업혁명의 한 축에서 최신 기술이었던 AI/ML이 이제는 기본이 되어가고 있다는 것을 느낄 수 있었다.


​1. From PoC to Production: 기계 학습을 조직 내 정착시키기 위한 전략


From PoC to Production Strategies for embracing machine learning in organizations KR (awscloud.com)

 

From PoC to Production: 기계 학습을 조직 내 정착 시키기 위한 전략

기계 학습(ML) 프로젝트의 경우, PoC 또는 파일럿 프로젝트 수준에서 고도화되지 못한 채 머물거나 조직 내 널리 활용되지 못하는 경우가 많습니다. 기계 학습을 조직 내에서 확산시키기 위해서

kr-resources.awscloud.com

 

이 강연에서는 ML을 조직내에 정착시키기 위한 방법에 대해 설명해주고 있다. 따라서 코드 단위의 내용은 다루지 않고 있다. PoC는 Proof of Concept의 줄임말로, 신기술 도입을 위한 검증 과정으로 보면 된다.

내용을 간단히 요약해보자!

 

  • ML을 조직내 정착/확산시키기 위해서는 일반적으로 7개 단계로 구성되며, 긴 시간의 여정이 필요하다.
    1. Culture
    2. Team enablement
    3. Data strategy
    4. Proof of Concept
    5. Repeatability
    6. Scale
    7. Evolution
  • 일반적으로 사내 Culture 정착과 Team enablement 가 가장 먼저 이루어져야 한다. 즉, 구성원(사람)에서부터 시작해야 한다.
    • ML 팀이 어떤 목표로 갖고 어떤 일을 할 지에 대해서 기대치가 명확히 정의되어 있어야 한다.(결정권자와 기대치를 맞춰야 한다.)
  • ML 프로젝트는 기능 중심의 팀으로 구성되어진다.
    • 소규모 조직인 경우, 보통 데이터 사이언스 스킬 + DevOps 스킬을 가진 구성원으로 조직
    • 대규모 조직인 경우, 팀 구성이 커지며 키 + 서포트 역할이 구분
    • 키 멤버: 데이터 엔지니어 / 데이터 사이언티스트 (/ 소프트웨어 엔지니어)
    • 서포트 멤버: DevOps 엔지니어링 팀 / IT 관리 팀 / 보안 팀
  • ML에 대한 초기 PoC를 진행하지 못한 조직은 고려 중인 ML 프로젝트가 비즈니스에 어떤 임팩트가 있을지 생각해볼 필요가 있다.
    • 새로운 프로젝트 생성, 비즈니스 프로세스 자동화를 통한 효율성보다는,
      기존 프로덕션에 더해져 어떤 비즈니스 밸류가 더해지며 조직 내에 어떤 영향을 줄 수 있는지를 생각해보기
    • 정확도-성능 트레이드오프를 설정해 프로젝트 성공 여부 판단 기준 정하기
    • 타임 바운드(기한) 설정하기 (보통 2~6개월)
  • 반복 가능한 ML 파이프 라인을 코드로 관리해야 한다.
    • end to end 파이프 라인 생성 시 다양한 이벤트에 대한 대응이 가능해진다.
    • 팀 간의 수동적 업무들을 최소화/자동화시켜야 한다.
  • CoE(Center of Excellence) 조직을 생성할 필요가 있다.
    • ML이 조직 내 정착하고 여러 팀이 생겼을 경우 필요된다.
    • 모든 머신러닝 팀에 대한 기반이 되는 지원을 제공하는 팀으로, 각 팀의 업무 진행을 방해하지 않기 위해 독립적인 팀으로 분리하는 것은 좋지 않다.
    • 각 팀 내에서 순환 차출해 CoE 운영을 하거나, 팀원별 ML업무와 CoE업무 시간 분리 등을 통해 CoE 팀과 ML 팀이 긴밀한 관계를 유지하도록 해야 한다.
  • 처음 소개한 7단계의 ML 정착/확산 방식은 반복되어야 한다.
    • 따라서 조직 내 문화가 중요하다.
    • 지속적으로 반복해 혁신을 이뤄야 한다.

 

내가 다니는 회사에서는 아직 ML을 적용하지는 않았지만, 적용할 수 있는 부분이 많지 않을까 생각도 된다. 이미 회사 제품군과 동일하면서 AI 적용한 제품이 시중에 있는 것으로 보인다. 추후에는 우리 회사에서도 AI/ML을 도입할 수도 있을 것 같은데 어떻게 나아갈지 궁금하다.


2. 기계 학습 전문지식 없이 Amazon Personalize에서 맞춤형 추천 기능 개발하기


Developing custom recommendations in Amazon Personalize without machine learning expertise KR (awscloud.com)

 

기계 학습 전문지식 없이 Amazon Personalize에서 맞춤형 추천 기능 개발하기

개인화 추천 AI/ML 알고리즘은 마케팅, 리테일, 금융 등 여러 도메인에서 고객 경험을 개선하고 이익을 증대하기 위해 널리 사용되고 있습니다. Amazon Personalize는 개발자가 기계 학습 기술을 적용

kr-resources.awscloud.com

 

이 강연에서는 Amazon Personalize 에 대한 설명으로 대부분 구성되어 있다. 그래서 가볍게 듣기 좋았고, 실제 추천 서비스 도입에 관심이 있는 사람은 도움이 많이 될 것 같은 내용이다. 이 강연도 어려운 추천 알고리즘이나 모델에 대해서는 자세히 다루고 있지 않고 간단히 소개를 해주고 있어서, 정말 AI/ML에 대한 전문지식이 없어도 도입할 수 있을 것으로 보인다.

우선 간단히 요약을 먼저 해보자!

 

  • 개인화 추천
    • 넘치는 정보의 홍수 속에서 고객의 관심사에 맞게 정보를 큐레이팅 하여 제공하는 것이다.
    • (추천 알고리즘) 콘텐츠 기반 필터링 : 아이템 특성을 통해 비슷한 아이템 추천 (전통적 방식)
    • (추천 알고리즘) 협업 필터링 : 사용자와 아이템 간 상호작용 정보를 기반으로 아이템 추천 (보다 초개인화 추천)
    • 오늘날은 초개인화 추천 시대다. 추천 서비스 도입은 필수적이다.
    • 소비자는 차별화된 고객 경험을 기대한다. 하지만, 소비자들 사이에서 개인화 추천은 더 이상 차별화된 서비스가 아닌 표준 서비스로 여기고 있다.
  • 개인화 추천의 과제 > Amazon Personalize로 해결 가능?!
    • 신규 상품/신규 사용자에 대한 데이터 부족 (Cold Start)
    • 적절한 기술과 ML 기술을 가진 전문 인력 고용의 어려움
    • 개발 및 관리의 시간/비용 부담
  • Amazon Personalize
    • 이커머스, 영산 산업 등에서 다양하게 사용되고 있다.
    • Built-in Recipe를 사용해 ML 전문지식 없이 개인 추천 모델을 쉽게 만들 수 있다.
    • 다양한 언어의 SDK를 지원해 API 기반 추천 결과의 생성/활용을 할 수 있으며, 앱/웹/이메일 마케팅 시스템에 통합하기 쉽다.
    • 고객이 입력한 모든 데이터는 암호화/비공개다. Amazon.com 자체에도 비공유한다.
    • 현재 보는 페이지 정보를 실시간 입력 및 추천 정보 갱신을 통해, 실시간 추천 기능도 제공 가능하다.
  • (Amazon Personalize) 추천 서비스 도입 시 고려사항
    • 적은 데이터 사이즈
    • 단순한 룰 기반 추천 사용
    • 익명 사용자로 인한 장기적 데이터 또는 사용자 메타 데이터 활용의 어려움

 

이번 강연에서는 온전히 Amazon Personalize 서비스에 대한 설명이 중심이다. 실제 데이터를 제공해 실제로 따라 하면서 서비스를 사용해볼 수 있도록 추천 서비스를 사용하는 데모 영상이 준비되어 있기도 하다. 그래서 ML 전문지식 없이 추천 서비스에 관심이 있는 경우에는 큰 도움이 될 것 같다.

 

강연을 보면서 궁금했던 것은 Cold Start에 대해 어느 정도 대응이 가능한 것처럼 말씀하셨는데, 실제로 얼마나 효과적으로 대응이 되는지 궁금하다. 그리고, 비정형 텍스트 데이터에 대해서도 최신 자연어 처리 도입으로 주요 정보를 자동 추출하고 있다고 하는데, 이에 대한 지표도 없어서 어느 정도로 효과적인지 궁금하다.


3. 동화기업, Smart Factory 데이터 분석 사례


Dongwha Enterprise, Smart Factory data analytics case (based on Amazon SageMaker) KR (awscloud.com)

 

동화기업, Smart Factory 데이터 분석 사례 (Amazon SageMaker 기반)

동화기업의 제조업과 Smart Factory의 배경 및 동화기업이 공정 최적화를 추진한 목적과 얻고자 한 성과에 대해 소개합니다. 추진 과정에서 Amazon SageMaker를 선택한 이유, AWS와의 협업 방법, 현재까지

kr-resources.awscloud.com

 

이 강연은 실제 '동화기업'에서 Smart Factory를 적용한 사례를 설명하고 있다. 간단히 동화기업은 목재 산업을 위주로 하는 기업이라고 한다. 

본 강연에서는 Amazon SageMaker에 대한 설명이 대부분이었고, Smart Factory를 구축하는 데 있어서 많은 전문지식이 요구된다는 것이 느껴졌다.

강연에 대해 실제 사례를 설명한 것이라서 요약할 것이 별로 없는데, 일단 해보자!

 

  • SF(Smart Factory) 도입
    • 제조 과정에서 많이 활용되는 기법 중에서, 동화기업의 목표와 필요점에 부합되는 과제를 선정하고 각 활용 분야에서 문제 해결이 되는지를 중심으로 도입 과제 선정
    • 생산 최적화(품질 예측을 통한 최적 공정 조건 추천)와 재고관리(원재료 재고량 측정)를 선정해 집중적으로 SF 도입
    • 여러 고려사항에 의해 Amazon SageMaker 사용을 결정했다.
    • 기존 저장소 및 서비스를 AWS로 사용하고 있었고, 주피터 랩을 통한 분석 업무를 그대로 수행할 수 있어서 도입에 추가적인 장점이 있었다.
    • 어려움이 있었고, AWS 도움을 받아 과제를 수행했다.
    • AWS Manucaturing Boost Program 참여했다.
    • PoC Office Hour를 통해 전문가 채널을 지원함으로써 문제 해결/가이드를 요청할 수 있었다.
    • 분석 업무 데이터 레이크 및 ML 모델 운영을 위한 파이프라인을 설계했고, 비즈니스 성과 달성을 위한 아키텍처 수립을 통해, 중/장기적인 방향성을 가져갈 수 있었다.
  • 생산 최적화 과제
    • 품질 기반의 최적화를 위해 생산-품질 데이터의 관계가 매우 중요했다.
    • 과거에는 품질에 대한 샘플링 검사를 수행했으나, 현재는 전수 검사 수행 장비의 도입으로 품질 데이터를 충분히 확보할 수 있다.
    • 과거에는 설비 업체에서 제공한 분석 도구를 사용했으나, 최초 모델링 이후 개선이 없는 등으로 인해 예측 정확도가 떨어졌으며, 모든 설비가 해당 업체의 설비가 아니기 때문에 공정 전체적으로 통합 관리가 되지 않았었다.
    • 현재는 강화 학습 콘셉트의 정규화 과정을 통해 좋은 품질의 공정 조건을 찾게 되었다.
  • 원재료 재고량 측정 과제
    • 기존에는 작업자 목측으로 판단하고 있었는데, 현재는 사일로 내 카메라를 설치하고 이미지를 통해 원재료 재고량을 측정한다.
    • 이러한 작업 시 레이블링이 가장 오래 걸리는 작업이지만, SageMaker의 GroundTruth를 통해 손쉽게 레이블링 작업을 할 수 있었다.

 

Smart Factory 구축 이후 시간이 얼마 지나지 않았지만, 얼마나 업무 효율이 향상되었는지에 대한 지표가 있었으면 좋았을 것 같다.

다만, 기존에 공장 내 전문가들에 의한 작업들로 숙련도에 따른 업무 편차가 있었을 텐데 이를 평균화시킨 것에서는 의미가 큰 것 같다.


4. 지능형 검색 서비스인 Amazon Kendra 통해 자연어 검색으로 원하는 답변을 빠르고 정확하게 얻어보기


Get the answers you want quickly and accurately with natural language search through Amazon Kendra K (awscloud.com)

 

지능형 검색 서비스인 Amazon Kendra 통해 자연어 검색으로 원하는 답변을 빠르고 정확하게 얻어보

Amazon Kendra는 지능형 검색 서비스로 컨텐츠 마이그레이션, 큐레이션 또는 텍스트 추출의 과정 없이도 데이터가 있는 곳을 가리키기만 하면 몇 분 내에 검색을 시작할 수 있게 합니다. 본 강연을

kr-resources.awscloud.com

 

'지능형 검색 서비스', '자연어 검색'이라는 키워드에 끌려서 본 강연을 보게 됐다. 본 강연은 '기계 학습 전문지식 없이 Amazon Personalize에서 맞춤형 추천 기능 개발하기'와 같이 데모와 함께 AWS 서비스를 소개하는 식으로 구성되어있다. Kendra에 대해 소개를 해주고 쉽게 애플리케이션에 적용할 수 있다고 한다.

일단 간단히 요약해보자!

 

  • 아마존은 모든 개발자, 데이터 사이언티스트, 사용자에게 사용 편리한 ML 제공을 목표로 하고 있다.
    • Kendra는 숙련된 ML 엔지니어 도움 없이 AI 서비스 API를 통해 탁월한 검색 경험을 제공한다.
    • Kendra는 자연어 쿼리에 대해 구조화/구조화되지 않은 데이터를 검색해주는 매우 정확한 지능형 검색 서비스다.
  • 점점 많은 데이터가 쌓이고 있으나 대부분 구조화되지 않고(unstructured), 널리 퍼져있어 자신에게 의미 있는 정보를 찾기 어려운 상황이다.
    • 그중 80%는 비정형 데이터이며, 대부분 기업에서 비정형 데이터 처리 방식을 전통적 방식에서 거의 바꾸지 않았다.
  • Kendra는 아래의 단계로 구성된다.
    • 자연어 처리
      • 구조화되지 안ㄴ은 콘텐츠의 문맥 검색
    • NLU & ML 코어
      • Reading comprehension : 텍스트 개념 이해 + 쿼리 의미 기반의 답변 추출
      • FAQ 매칭 : 사용자 쿼리와 일치시키고, 자주 묻는 질문을 살필 필요 없이 답변을 제공
      • Document ranking : 검색어 본 의미에 맞는 관련 문서 링크 목록을 반환
    • Domain expertise
      • 사용자 쿼리에 맞는 답변을 제공하기 위해 텍스트 이해를 위한 도메인별 용어들을 연결
      • 여러 도메인에 대한 사전 훈련으로 상황에 맞는 답변을 적절히 생성(14개 주요 도메인)
    • 지속적 개선
      • 증분 훈련을 통해 사용자 피드백을 통한 성능 자동 향상
    • Native & partner connectors
      • 커넥터를 간단히 연결시킴으로써, 데이터 소스 자동 최신화를 시킬 수 있다.(항상 최신 콘텐츠 검색 제공)
    • Secure search 
      • 검색 결과는 조직의 보안 모델을 반영하는 안전성을 나타낸다. (데이터 암호화 + 토큰 기반 사용자 접근 통제 제공)
  • Amazon Elasticsearch 와의 차이점
    • Elasticsearch는 단어 위주의 검색인 반면에, Kendra는 질의에 대한 정확한 가이드 위주로 답변한다.
  • 다국어 지원유무
    • Amazon Lex를 통해 빌드된 챗봇은 Amazon Comprehend로 사용자 언어 식별
    • Amazon Translate로 사용자 언어를 영어로 번역해 Kendra 인덱스 쿼리 실행
    • Kendra 실행 결과는 다시 Translate에 의해 사용자 언어로 번역되며, Lex를 통해 최종 반환
  • 제약사항
    • 문서 간 통과 집계 또는 계산이 필요한 답변은 현재 미지원
  • 데이터는 안전히 보관되고 있으며, Amazon.com 등 다른 곳에서 사용하지 않음

 

자연어 검색에 대해서 예전에 관심이 많았었는데, 이렇게 보니 이 역시도 많이 발전이 된 것 같다. 특히 공부할 때 너무 어려웠는데, 이렇게 손쉽게 제공하는 서비스까지 나와서 신기하다.

지능형 검색을 도입하길 원한다면, 데모를 통해 구축 방법이 나와있고, AWS 시스템 구성도 및 동작 방식에 대해 설명해주고 있어서 도움이 많이 될 것 같다.

 

다니는 회사에 적용할 부분은 없겠지만, 혹시 모르니 키워드 추출과 같은 부분은 나중에 시간 날 때 공부해두면 좋을 것 같다.


온라인 컨퍼런스는 오랜만에 참여하는 것 같고, 정리해보는 건 처음인 것 같다.

AWS에서 하는 것이라서 크게 도움 안될 줄 알았는데, 최근 AI/ML과 클라우드 관련 동향을 알 수 있는 기회였다. 모든 강연들이 흥미 있기는 했으나, ML을 조직 내에 정착시키는 과정이 어떻게 이루어져야 하는지에 대해서 다룬 강연이 특히 흥미가 있었다.

기업이 커지는 것처럼 ML팀을 만드는 과정이 어떻게 이루어지는지에 대해서 훔쳐볼 수 있는 기회였다.

728x90