AWS 기술 블로그

Amazon OpenSearch Service의 Multi-AZ with Standby 기능 동작 방식 알아보기

Amazon OpenSearch Service 는 비즈니스 크리티컬 워크로드에 99.99%의 가용성과 일관된 성능을 제공하는 관리형 클러스터를 위한 Multi-AZ with Standby 배포 옵션을 제공합니다. Multi-AZ with Standby를 사용하면 OpenSearch Service 도메인은 하드웨어 또는 네트워킹 장애와 같은 인프라 장애에 대해 복원력을 갖출 수 있습니다. 이 옵션은 안정성이 향상되고 모범 사례를 적용하고 복잡성을 줄임으로써 클러스터 구성 및 관리를 간소화하는 추가적인 […]

알리는사람들의 서버리스 기반 현대화 여정 – DynamoDB 최적화 사례

알리는사람들 소개 알리는사람들은 기업의 원활한 커뮤니케이션을 돕는 메시징 솔루션을 개발하는 스타트업 입니다. 다양한 메시징 채널을 통합하여 고객에게 메시지가 효과적으로 도달할 수 있도록 지원하며, 현재 다수의 기업이 알리는사람들의 솔루션을 활용해 고객 알림, 인증, 마케팅 메시지 등을 효율적으로 운영하고 있습니다. Sendon 서비스 소개 센드온(Sendon)은 기업을 위한 클라우드 네이티브 메시징 서비스입니다. 개발자가 쉽게 활용할 수 있도록 강력한 API와 […]

Amazon Bedrock에서 DeepSeek-R1 Distilled Llama 모델 배포하기

오픈 파운데이션 모델(Open Foundation Models, FM)은 생성형AI 혁신의 초석이 되어, 조직들이 비용과 배치 전략을 통제하면서 AI 애플리케이션을 구축하고 맞춤화할 수 있도록 해줍니다. AI 커뮤니티는 공개적으로 이용 가능한 고품질의 모델을 제공함으로써, 개발자와 최종 사용자 모두에게 이익이 되는 신속한 반복, 지식 공유, 비용 효율적인 솔루션을 촉진합니다. AI 기술 발전에 주력하는 연구 회사인 DeepSeek AI는 이 생태계에 크게 […]

AWS가 제공하는 완전관리형 병렬 파일시스템, Amazon FSx for Lustre – 2

이전 블로그에서는 병렬 파일시스템의 기본 개념과 특징 그리고 대표적인 병렬 파일시스템인 Lustre에 대해 살펴보았습니다. 또한 AWS에서 제공하는 완전 관리형 Lustre 파일시스템인 Amazon FSx for Lustre에 대해서도 알아보았습니다. 병렬 파일시스템은 무엇이고 왜 필요할까? 지구상에서 가장 인기있는 병렬 파일시스템, Lustre 파일시스템 알아보기 AWS가 제공하는 완전 관리형 병렬 파일시스템, Amazon FSx for Lustre – 1 이번 블로그는 시리즈의 […]

AI 응답성 최적화하기: Amazon Bedrock 지연 시간 최적화 추론에 대한 실용적인 가이드

이 글은 AWS Machine Learning 블로그의 Optimizing AI responsiveness: A practical guide to Amazon Bedrock latency-optimized inference by Ishan Singh, Ankur Desai, Rupinder Grewal, Vivek Singh, and Yanyan Zhang의 한국어 번역입니다. 상용 생성형AI 애플리케이션에서 반응성은 모델의 성능(정확도)만큼이나 중요합니다. 시간에 민감한 문의 사항을 처리하는 고객 서비스 팀이든, 즉각적인 코드 제안이 필요한 개발자이든, 지연 시간(대기 시간)으로 알려진 1초의 지연도 상당한 영향을 미칠 […]

AWS 데이터 분석 서비스 기반 게임 레벨링 환경 구성 사례

개요 기존의 문제 상황 소규모 인디게임 개발사는 작은 규모와 한정된 자원에도 불구하고 창의성과 혁신성을 발휘하며 새로운 게임 경험을 선사합니다. 하지만 이러한 장점에도 불구하고, 게임 개발 과정에서 적지 않은 과제에 직면하곤 합니다. 특히 게임 출시 전 완성도를 높이기 위한 테스팅과 난이도 조정 작업은 매우 중요하지만, 인력이 부족한 인디 게임 스튜디오에서는 이러한 작업을 충분히 수행하기 어려운 상황입니다. […]

비정형 데이터! Amazon Bedrock으로 제대로 활용하기

오늘날 기업들은 전례 없는 규모의 비정형 데이터를 보유하고 있습니다. 이메일, 문서, 이미지, 동영상, 소셜 미디어 게시물 등 다양한 형태의 비정형 데이터는 모든 엔터프라이즈 데이터에서 80%~90%를 차지하고 있으며, 정형 데이터보다 몇 배나 빠르게 증가하고 있습니다. 이러한 방대한 비정형 데이터에는 시장 트렌드, 고객 니즈, 운영상의 문제점 등 귀중한 인사이트가 있습니다. 하지만 약 18%의 기업만이 이러한 데이터를 효과적으로 […]

Amazon Bedrock과 Amazon Neptune으로 지식 그래프를 활용한 GraphRAG 애플리케이션 구축하기

이 글은 AWS Database 블로그의 Using knowledge graphs to build GraphRAG applications with Amazon Bedrock and Amazon Neptune의 한국어 번역입니다. 검색 증강 생성(Retrieval Augmented Generation, RAG)은 대규모 언어 모델과 외부 지식 소스를 결합하는 혁신적인 접근 방식으로, 더 정확하고 정보가 풍부한 콘텐츠 생성을 가능하게 합니다. 이 기술은 언어 모델의 맥락 이해 및 일관된 응답 생성 능력과 […]

SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례

이 블로그는 SK hynix 오세진 TL, 노정기 TL, 오태진 TL 이 함께 작성하였습니다. SK 하이닉스는 AI 시대라는 새로운 세상의 중심에 반도체가 있다는 사명감을 가지고 최고의 기술력을 향해 끊임없는 혁신을 이뤄 가고 있습니다. 세계 최고 성능의 HBM3를 최초 개발 및 출시한 데 이어 확장 버전인 HBM3E 역시 세계 최초 양산에 성공하며 메모리 반도체 시장을 선도하고 있고, 세계 […]

전용 코디네이터 노드를 사용한 Amazon OpenSearch Service 클러스터 복원력과 성능 향상

이 글은 Akshay Zade 님이 직성하신 “Improve OpenSearch Service cluster resiliency and performance with dedicated coordinator nodes” 포스팅을 한글로 번역 한 Posting입니다. Amazon OpenSearch Service에서 OpenSearch 도메인을 생성할 때, 기존에는 데이터 노드가 여러 역할을 동시에 수행했습니다. 데이터 노드는 색인 요청 및 검색 요청을 조정할 뿐만 아니라, 색인 문서를 처리하고 검색 쿼리에 응답하는 작업까지 담당했습니다. 또한, […]