OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。この#6~#7では、AWS Glue プロダクトチームの関山 宜孝さんをゲストにOpen Table Format (OTF) のユースケースについてお話を伺いました。
※今回録音環境に問題があったため、ゲストの声が聴きづらくなっています。
ゲスト: Noritaka Sekiyama (@moomindani)
AWS Glue product team 所属の Principal Big Data Architect
host: @simosako (下佐粉 昭)
AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。
※感想は #OTFTalk でポストいただけると励みになります。
※発言は各個人のものであり、所属組織を代表するものではありません。
第6回:OTFのユースケース:CDCによるニアリアルタイムデータ連携
第7回:OTFのユースケース:個人情報保護のためのデータ削除
参考文献)
Apache Iceberg のChangelog View解説(べりんぐさんのブログ)
https://bering.hatenadiary.com/entry/2024/03/31/150946
OSSのCDCツール Debezium https://debezium.io/
データベースをCDCでApache Icebergに反映するサンプル構成 (AWS Blog)
メダリオンアーキテクチャ (databricks)
https://www.databricks.com/jp/glossary/medallion-architecture
EUの一般データ保護規則(GDPR) https://www.ppc.go.jp/enforcement/infoprovision/EU/
日本の改正個人情報保護法 https://www.ppc.go.jp/news/kaiseihou_feature/
Yahoo! Japan 事例 「Apache Hudi を用いてレコード単位で削除可能なデータレイクを構築した話」
コメント
コメントを投稿