理解下这个变化

/*
 * swapper_space is a fiction, retained to simplify the path through
 * vmscan's shrink_page_list.
 */

 // todo 如果不定义， shrink_page_list 的写法修改如果!
 // 这个 address_space_operations 所挂载的 address 不会在inode 之类的上，想要访问必须持有 swp_entry_t
 // 既然如此，那么就不需要这一个封装了
static const struct address_space_operations swap_aops = {
	.writepage	= swap_writepage,
	.set_page_dirty	= swap_set_page_dirty,
#ifdef CONFIG_MIGRATION
	.migratepage	= migrate_page,
#endif
};

/*
 * swapper_space is a fiction, retained to simplify the path through
 * vmscan's shrink_page_list.
 */
static const struct address_space_operations swap_aops = {
	.writepage	= swap_writepage,
	.dirty_folio	= noop_dirty_folio,
#ifdef CONFIG_MIGRATION
	.migrate_folio	= migrate_folio,
#endif
};

理解下这个 4c4a763406ef903b78334bd2ccea168d2f7a741a

如何理解其中的 migrate_folio

为什么只有注册了一个 writepage

/*
 * swapper_space is a fiction, retained to simplify the path through
 * vmscan's shrink_page_list.
 */
static const struct address_space_operations swap_aops = {
	.writepage	= swap_writepage,
	.dirty_folio	= noop_dirty_folio,
#ifdef CONFIG_MIGRATION
	.migrate_folio	= migrate_folio,
#endif
};

swap_writepage 在 shmem 中被直接使用，因为 shmem 总是写入到 swap 中的，不存在写入到文件中的情况，无需通过。
init_swap_address_space
int init_swap_address_space(unsigned int type, unsigned long nr_pages) // 被函数被 swapon 系统调用唯一调用使用

既然不会写回，那么其实不去 mark dirty 也没关系，除非，mark dirty 还有其他的用途，例如改变 reclaim 的行为。

dirty

int swap_set_page_dirty(struct page *page)
{
	struct swap_info_struct *sis = page_swap_info(page);

	if (sis->flags & SWP_FILE) {
		struct address_space *mapping = sis->swap_file->f_mapping;

		VM_BUG_ON_PAGE(!PageSwapCache(page), page);
		return mapping->a_ops->set_page_dirty(page);
	} else {
		return __set_page_dirty_no_writeback(page);
	}
}

__set_page_dirty_no_writeback 被 folio 替换为 noop_dirty_folio
https://lwn.net/Articles/879027/ : 解释为什么将 swap_set_page_dirty 去掉了，其中 __set_page_dirty_no_writeback
- https://patchwork.kernel.org/project/linux-nfs/patch/164661057804.13454.1512972233576670792.stgit@noble.brown/

为什么这么修改: 之前，将 page 作为 fs 的 page cache ，之后 fs 的 wb 会将 page cache 现在统一了 fs 和 blk 作为 swap 的时候 swap cache 的行为。

swap cache

/sys/kernel/mm/swap/vma_ra_enabled 来控制是否 readahead
建立 radix_tree 的过程，多个文件，多个分区，各自大小而且不同 ? init_swap_address_space 中说明的，对于一个文件，每 64M 创建一个 radix_tree，至于其来自于那个文件还是分区，之后寻址的时候不重要了。init_swap_address_space 被 swapon 唯一调用
```
struct address_space *swapper_spaces[MAX_SWAPFILES] __read_mostly;
static unsigned int nr_swapper_spaces[MAX_SWAPFILES] __read_mostly;
```
谁会调用 add_to_swap 这一个东西 ?
1. 认为 : 当 anon page 发生 page fault 在 swap cache 中间没有找到的时候，创建了一个 page，于是乎将该 page 通过 add_to_swap 加入到 swap cache
2. 实际上 : 只有 shrink_page_list 调用，这个想法 __read_swap_cache_async 实现的非常不错。
3. 猜测 : 当一个 page 需要被写会的时候，首先将其添加到 swap cache 中间 ```c /** * add_to_swap - allocate swap space for a page * @page: page we want to move to swap * * Allocate swap space for the page and add the page to the * swap cache. Caller needs to hold the page lock. */ int add_to_swap(struct page *page) get_swap_page // 分配 swp_entry_t // todo 实现比想象的要复杂的多，首先进入到 swap_slot.c 但是 swap_slot.c 中间似乎根本不处理什么具体分配，而是靠 swapfile.c 的 get_swap_pages // todo 获取到 entry.val != 0 说明 page 已经被加入到 swap 中间 ? add_to_swap_cache // 将 page 和 swp_entry_t 链接起来，形成 set_page_dirty // todo 和 page-writeback.c 有关，line 240 的注释看不懂 put_swap_page // Called after dropping swapcache to decrease refcnt to swap entries ，和 get_swap_page 对称的函数，核心是调用 free_swap_slot

// 从 get_swap_page 和 put_swap_page 中间，感觉 swp_entry_t 存在引用计数 ? 应该不可能呀 !

4. 利用 swap_cache_info 来给管理员提供信息
```c
static struct {
  unsigned long add_total;
  unsigned long del_total;
  unsigned long find_success;
  unsigned long find_total;
} swap_cache_info;

问题:

两种的 readahead 机制 swap_cluster_readahead 和 swap_vma_readahead 的区别 ?

/**
 * swapin_readahead - swap in pages in hope we need them soon
 * @entry: swap entry of this memory
 * @gfp_mask: memory allocation flags
 * @vmf: fault information
 *
 * Returns the struct page for entry and addr, after queueing swapin.
 *
 * It's a main entry function for swap readahead. By the configuration,
 * it will read ahead blocks by cluster-based(ie, physical disk based)
 * or vma-based(ie, virtual address based on faulty address) readahead.
 */
struct page *swapin_readahead(swp_entry_t entry, gfp_t gfp_mask,
     struct vm_fault *vmf)
{
  return swap_use_vma_readahead() ?
   swap_vma_readahead(entry, gfp_mask, vmf) :
   swap_cluster_readahead(entry, gfp_mask, vmf);
}

什么时候使用 readahead，什么时候使用 page-io.c:swap_readpage ?
memory.c::do_swap_page 中间说明
add_to_swap 和 add_to_swap_cache 的关系是什么 ?
add_to_swap 首先调用 swap_slot.c::get_swap_page 分配 swap slot，然后调用 add_to_swap_cache 将 page 和 swap slot 关联起来。
swap cache 的 page 和 page cache 的 page 在 page reclaim 机制中间有没有被区分对待 ? TODO
swap cache 不复用 page cache ?
两者只是使用的机制有点类似，通过索引查询到 page frame，但是 swap cache 的 index 是 swp_entry_t，而 page cache 的 index 是文件的偏移量。对于每一个文件，都是存在一个 radix_tree 来提供索引功能，对于 swap，

本站所有文章转发 CSDN 将按侵权追究法律责任，其它情况随意。