機械学習の論文紹介や実装方法について挙げていきます。
簡単!機械学習用の環境構築(Docker, GPU)
GPUが利用できる機械学習環境をDockerを使って構築していきます。導入メリットGPUの設定とかが楽(あまり細かいことを考えなくて済む)環境が壊れてもすぐに再構築できる新しいPCにもすぐに環境を構築できる環境私の環境は以下の通りです。Wi...
論文紹介「FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness」
以下の内容は、基本的に元論文をDeepLで翻訳したものです。概要Self-Attentionの時間とメモリの複雑さはシーケンスの長さの2次関数であるため、長いシーケンスではTransformerは遅く、メモリを消費する。近似的なAttent...
論文紹介「Meet ChatLLaMA: The First Open-Source Implementation of LLaMA Based on Reinforcement Learning from Human Feedback (RLHF)」
概要LLaMAは、Meta社が公開した大規模言語モデルで、7Bから65Bのパラメータを持つ事前学習済みモデルです。数兆個のトークンでモデルを訓練しており、公開データセットのみを使用して最先端のモデルを訓練することが可能となっています。LLa...
Graph Convolutional Network
こちらの記事では、GCN(Graph Convolutional Networks) の使い方について解説します。yeahafdaf