Fill your skill gaps in AI and Data Science

External Tag: Amazon EC2

Accelerated PyTorch inference with torch.compile on AWS Graviton processors

External Tags Amazon EC2, Amazon Machine Learning, best-practices, Expert (400), Graviton, how-to, Natural Language Processing, open source, pytorch, PyTorch on AWS, Technical How-to

Get started quickly with AWS Trainium and AWS Inferentia using AWS Neuron DLAMI and AWS Neuron DLC

External Tags AIML, Amazon EC2, Amazon EC2 Container Service, Amazon Elastic Container Registry, Amazon Elastic Kubernetes Service, Amazon SageMaker, artificial-intelligence, AWS Inferentia, AWS Neuron, AWS Trainium, compute, Intermediate (200), Neuron

Sprinklr improves performance by 20% and reduces cost by 25% for machine learning inference on AWS Graviton3

External Tags Amazon EC2, Amazon EC2 Container Registry, Amazon EC2 Container Service, Customer Solutions, Graviton

End-to-end LLM training on instance clusters with over 100 nodes using AWS Trainium

External Tags Amazon EC2, AWS Neuron, AWS Trainium, best-practices, distributed training, Neuron, Technical How-to

Scale AI training and inference for drug discovery through Amazon EKS and Karpenter

External Tags AI/ML, Amazon EC2, Amazon EC2 Container Registry, Amazon Elastic Kubernetes Service, best-practices, Customer Solutions, generative-ai, Technical How-to

Large language model inference over confidential data using AWS Nitro Enclaves

External Tags Amazon EC2, AWS Key Management Service, Customer Solutions, Expert (400), Healthcare, Technical How-to

Introducing three new NVIDIA GPU-based Amazon EC2 instances

External Tags Amazon EC2, Announcements

Amazon EC2 DL2q instance for cost-efficient, high-performance AI inference is now generally available

External Tags Amazon EC2, artificial-intelligence, Customer Solutions

Enable pod-based GPU metrics in Amazon CloudWatch

External Tags Advanced (300), Amazon CloudWatch, Amazon EC2, Amazon Elastic Kubernetes Service

Maximize Stable Diffusion performance and lower inference costs with AWS Inferentia2

External Tags Advanced (300), Amazon EC2, Amazon SageMaker, AWS Inferentia