Skip to the content.

QEMU 中的 seabios : fw_cfg

Why QEMU needs fw_cfg

seabios 可以在裸机上,也可以在 QEMU 中运行,在 QEMU 中运行时,通过 fw_cfg 从 host 获取 guest 的各种配置或者 rom 会相当的方便。

比如在 ./hw/i386/fw_cfg.c 中 fw_cfg_arch_create 中,使用 fw_cfg 可以容易将 guest 的主板的 CPU 的数量通知给 guest。

    fw_cfg_add_i16(fw_cfg, FW_CFG_MAX_CPUS, apic_id_limit);

Implement details

fw_cfg 出现在两个文件中, hw/nvram/fw_cfg.c 和 hw/i386/fw_cfg.c, 前者是通用的实现,后者主要是为架构中添加一些细节。

transfer method

IO transfer

和其他任何 pio 相同,fw_cfg 传输也是通过在注册 MemoryRegion 的方式.

具体来说就是, 在 fw_cfg_io_realize 中初始化 MemoryRegion comb_iomem

    memory_region_init_io(&s->comb_iomem, OBJECT(s), &fw_cfg_comb_mem_ops,
                          FW_CFG(s), "fwcfg", FW_CFG_CTL_SIZE);

然后在 fw_cfg_init_io_dma 中添加进去

    sysbus_add_io(sbd, iobase, &ios->comb_iomem); // iobase = FW_CFG_IO_BASE,也就是 0x510

之后 guest 只要读写 FW_CFG_IO_BASE 的位置,就会触发 fw_cfg_comb_mem_ops 的操作。

static void fw_cfg_comb_write(void *opaque, hwaddr addr,
                              uint64_t value, unsigned size)
{
    switch (size) {
    case 1:
        fw_cfg_write(opaque, (uint8_t)value);
        break;
    case 2:
        fw_cfg_select(opaque, (uint16_t)value);
        break;
    }
}

在 seabios 这一侧的定义是对应的

./src/fw/paravirt.h

#define PORT_QEMU_CFG_CTL           0x0510
#define PORT_QEMU_CFG_DATA          0x0511

例如 seabios 想要获取 CPU 数量的执行流程

注意,实际上 QEMU 关于 fw_cfg 实现了两套方案,默认使用的是 fw_cfg_io_info

static void fw_cfg_register_types(void)
{
    type_register_static(&fw_cfg_info);    // parent
    type_register_static(&fw_cfg_io_info); // 采用的这一套解决方法
    type_register_static(&fw_cfg_mem_info);
}

DMA transfer

使用 pio 传输,每次最多只能传输 long 的大小,但是代价是一次 vmexit,传输大量数据的时候,效率会很低。

为此需要多注册一个端口 fwcfg.dma,传输 QemuCfgDmaAccess 的地址

static void
qemu_cfg_dma_transfer(void *address, u32 length, u32 control)
{
    QemuCfgDmaAccess access;

    access.address = cpu_to_be64((u64)(u32)address);
    access.length = cpu_to_be32(length);
    access.control = cpu_to_be32(control);

    barrier();

    outl(cpu_to_be32((u32)&access), PORT_QEMU_CFG_DMA_ADDR_LOW);

    while(be32_to_cpu(access.control) & ~QEMU_CFG_DMA_CTL_ERROR) {
        yield();
    }
}

在 QEMU 这里 QemuCfgDmaAccess 的信息在 fw_cfg_dma_transfer 中解析,最后调用到 dma_memory_write / dma_memory_read 完成数据传输。

file

fw_cfg 可以支持多种数据类型,

file 类型和其他的类型有一些区别,并不是因为数据保存在文件中的原因, 不管那种类型的,数据的地址保存 FWCfgEntry::data 中的。 也不是因为数据大小的原因。file 的类型主要是为了灵活性

实际上,fw_cfg 需要让 host 和 guest 传输多种数据,这些数据都是保存在数组 FWCfgState::entries 中的, 对于一些常用/有名的,host 和 guest 存在公共的约定索引

架构无关的在: include/standard-headers/linux/qemu_fw_cfg.h

/* selector key values for "well-known" fw_cfg entries */
#define FW_CFG_SIGNATURE	0x00
#define FW_CFG_ID		0x01
#define FW_CFG_UUID		0x02
#define FW_CFG_RAM_SIZE		0x03
#define FW_CFG_NOGRAPHIC	0x04
// ...

和架构相关的内容放到了 ./hw/i386/fw_cfg.h

#define FW_CFG_ACPI_TABLES      (FW_CFG_ARCH_LOCAL + 0)
#define FW_CFG_SMBIOS_ENTRIES   (FW_CFG_ARCH_LOCAL + 1)
#define FW_CFG_IRQ0_OVERRIDE    (FW_CFG_ARCH_LOCAL + 2)
#define FW_CFG_E820_TABLE       (FW_CFG_ARCH_LOCAL + 3)
#define FW_CFG_HPET             (FW_CFG_ARCH_LOCAL + 4)

如果想要添加一个新的内容,比如 smbios 的配置,就需要修改所有的 host 和 guest 的代码, 于是设计出来了 file

因为很多 fw_cfg 使用约定好的 index,但是新添加的,有一些采用名称来区分

文件的处理方法:

使用图形表示就是:

在去分析具体的源码就很容易了:

在 QEMU 这一侧进行组装:

void fw_cfg_add_file_callback(FWCfgState *s,  const char *filename,
                              FWCfgCallback select_cb,
                              FWCfgWriteCallback write_cb,
                              void *callback_opaque,
                              void *data, size_t len, bool read_only)
{

    // ...
    if (!s->files) {
        dsize = sizeof(uint32_t) + sizeof(FWCfgFile) * fw_cfg_file_slots(s);
        s->files = g_malloc0(dsize);
        fw_cfg_add_bytes(s, FW_CFG_FILE_DIR, s->files, dsize);
    }

    // ...
    fw_cfg_add_bytes_callback(s, FW_CFG_FILE_FIRST + index,
                              select_cb, write_cb,
                              callback_opaque, data, len,
                              read_only);

    s->files->f[index].size   = cpu_to_be32(len);
    s->files->f[index].select = cpu_to_be16(FW_CFG_FILE_FIRST + index);
    s->entry_order[index] = order;

在 seabios 中首先读取所有的 file 信息

void qemu_cfg_init(void)
{
    // Load files found in the fw_cfg file directory
    u32 count;
    qemu_cfg_read_entry(&count, QEMU_CFG_FILE_DIR, sizeof(count));
    count = be32_to_cpu(count); // 一共有多少个文件
    u32 e;
    for (e = 0; e < count; e++) {
        struct QemuCfgFile qfile;
        qemu_cfg_read(&qfile, sizeof(qfile)); // 读取一个 FWCfgFile
        qemu_romfile_add(qfile.name, be16_to_cpu(qfile.select) // 添加 file 到 RomfileRoot 数组中,之后可以通过文件名调用  romfile_find
                         , 0, be32_to_cpu(qfile.size));
    }

之后通过文件名就可以找到 index

static int
get_field(int type, int offset, void *dest)
{
    char name[128];
    snprintf(name, sizeof(name), "smbios/field%d-%d", type, offset);
    struct romfile_s *file = romfile_find(name);
    if (!file)
        return 0;
    file->copy(file, dest, file->size);
    return file->size;
}

在 fw_cfg_add_file_callback 可以截获所有的 file :

etc/boot-fail-wait
etc/e820
genroms/kvmvapic.bin
genroms/linuxboot_dma.bin
etc/system-states
etc/acpi/tables
etc/table-loader
etc/tpm/log
etc/acpi/rsdp
etc/smbios/smbios-tables
etc/smbios/smbios-anchor
bootorder
bios-geometry

ROM

QEMU 让 guest 访问 rom 大致可以如此划分:

分析具体的代码:

rom_reset 包含了有意思的小问题

ROM migration

之所以需要进行 ROM 的拷贝到 MemoryRegion 的原因:

  1. 被 MemoryRegion 的管理的数据在 migration 的时候会被 migration
  2. 但是 Rom::data 的数据不会
  3. 如果 guest 读取 Rom::data

这个问题在 04920fc0faa4760f9c4fc0e73b992b768099be70 中被解决

tree 90921644ff0d58e6e165cc439321328e5d771256
parent 0851c9f75ccb0baf28f5bf901b9ffe3c91fcf969
author Michael S. Tsirkin <mst@redhat.com> Mon Aug 19 17:26:55 2013 +0300
committer Michael S. Tsirkin <mst@redhat.com> Wed Aug 21 00:18:39 2013 +0300

loader: store FW CFG ROM files in RAM

ROM files that are put in FW CFG are copied to guest ram, by BIOS, but
they are not backed by RAM so they don't get migrated.

Each time we change two bytes in such a ROM this breaks cross-version
migration: since we can migrate after BIOS has read the first byte but
before it has read the second one, getting an inconsistent state.

Future-proof this by creating, for each such ROM,
an MR serving as the backing store.
This MR is never mapped into guest memory, but it's registered
as RAM so it's migrated with the guest.

Naturally, this only helps for -M 1.7 and up, older machine types
will still have the cross-version migration bug.
Luckily the race window for the problem to trigger is very small,
which is also likely why we didn't notice the cross-version
migration bug in testing yet.

Signed-off-by: Michael S. Tsirkin <mst@redhat.com>
Reviewed-by: Laszlo Ersek <lersek@redhat.com>

让 rom 和 mr 关联的原因: 因为 bios 无法自动同步,所以使用 MemoryRegion 保存 bios 从而可以自动 migration 解决方法:

modify

fw_cfg_add_bytes_callback 对于一个 entry 只能调用一次,如果想要修改就需要调用 fw_cfg_modify_bytes_read

FWCfgEntry callback

实际上注册了可选的 callback,

FWCfgEntry::select_cb 的唯一注册者为 acpi_build_update, 而 write_cb 从未使用过。