企業や公的機関がAWSなどのクラウドサービスを自社のデータ基盤に採用する事例が増えていますが、そうしたクラウドサービスの利用料金は決して安価ではありません。膨大なデータをクラウド上で管理しているNetflixが、自社のデータ基盤運用にかかる費用をどのように圧縮し、費用対効果を高めているのかを説明しています。 Byte Down: Making Netflix’s Data Infrastructure Cost-Effective | by Netflix Technology Blog | Jul, 2020 | Netflix TechBlog https://netflixtechblog.com/byte-down-making-netflixs-data-infrastructure-cost-effective-fee7b3235032 一般的には、データ基盤にかかる費用を管理する方法として、予算上限の設定や厳しい支出制限が用いられますが、高度に分散化されたデータ基盤を持ち、自由と責任を重んじるNetflixにおいて、こうした方法は逆文化的かつ非効率であるとのこと。データ基盤の費用対効果を高めるため、Netflixは費用を透明化し、費用対効果に関する情報をできるだけ意志決定者に近いところに配置するために、それらの情報をまとめたダッシュボードを開発しました。 Netflixで扱うデータの種類として、静的なデータと動的なデータがあるとのこと。静的なデータはAWS S3や Cassandra 、 Elasticsearch などに保存されるデータを指し、費用はストレージに紐付いています。対して動的なデータは Keystone や Flink などで処理されるデータであり、データを計算する費用に紐付いていると説明されています。

2020年07月14日 08時00分00秒 in ソフトウェア, ネットサービス, Posted by log1n_yi

