上一篇博客《C++物件模型:g++實作(一)》用我的理解總結了在無繼承體系下g++實作的C++物件的記憶體布局,這篇就來總結一下在有繼承情況下的C++物件的記憶體布局,
本文中所有代碼均可從這里拿到(百度網盤),
有繼承情況下的C++物件的記憶體布局
C++是支持多繼承的,而多繼承可能就會出現繼承的兩個(或多個)類有公共的父類,為了防止在一個物件中出現多個公共父類的物體,C++就提出了虛繼承,因此總的來說C++的繼承有兩種:無虛繼承和有虛繼承,
無虛繼承
在無虛繼承情況下,無論是public繼承還是protected、private繼承,其記憶體布局都是一樣的,因此這里只提供public繼承的例子,
所有的基類和派生類都沒有虛函式
在這種情況下,其實就相當于構造了一個物件,其內部按基類的宣告順序添加了各個基類物件,最后再添加派生類自己的物件,其對齊要求和類作為(非靜態)成員變數是一樣的,
// test09.cpp
#include <cstdio>
class Base1 {
public:
Base1(int i, char c)
:m_i(i), m_c(c)
{}
private: // 在Deriverd中:
int m_i; // Offset: 0
char m_c; // Offset: 4
}; // size: 8
class Base2{
public:
Base2(short s, int i)
: m_s(s), m_i(i) {}
private: // 在Deriverd中:
short m_s; // Offset: 8
int m_i; // Offset: 10
}; // size: 8
class Derived: public Base1, public Base2 {
public:
Derived(int i1, char c, short s, int i2, long l)
: Base1(i1, c), Base2(s, i2), m_l(l)
{}
long getLong() const { return m_l; }
private:
long m_l; // Offset: 16
}; // size: 8 + 8 + 8 = 24
int main() {
std::printf("sizeof Derived: %d\n", static_cast<int>(sizeof(Derived)));
Derived d(1, static_cast<char>(2), static_cast<short>(3), 4, static_cast<long>(5));
long l = d.getLong();
}
// Output:
// sizeof Derived: 24
使用gdb除錯,查看記憶體布局,如下:

如果不是按基類整體作為一個(非靜態)成員變數的話,Base2::m_s的offset應為6,但實際上其offset為8,因為Base2的對齊要求為4,
基類無虛函式,派生類有虛函式
這個也很簡單,只需要在整個類的頭部安插一個虛表指標vptr即可,
// test10.cpp
// 只是令Derived::getLong()為虛函式
#include <cstdio>
class Base1 {
public:
Base1(int i, char c)
:m_i(i), m_c(c)
{}
private: // 在Deriverd中:
int m_i; // Offset: 0
char m_c; // Offset: 4
}; // size: 8
class Base2{
public:
Base2(short s, int i)
: m_s(s), m_i(i) {}
private: // 在Deriverd中:
short m_s; // Offset: 8
int m_i; // Offset: 10
}; // size: 8
class Derived: public Base1, public Base2 {
public:
Derived(int i1, char c, short s, int i2, long l)
: Base1(i1, c), Base2(s, i2), m_l(l)
{}
virtual // 僅在此有改動
long getLong() const { return m_l; }
private:
long m_l; // Offset: 16
}; // size: 8 + 8 + 8 = 24
int main() {
std::printf("sizeof Derived: %d\n", static_cast<int>(sizeof(Derived)));
Derived d(1, static_cast<char>(2), static_cast<short>(3), 4, static_cast<long>(5));
long l = d.getLong();
}
// Output:
// sizeof Derived: 32
基類也有虛函式
在這種情況下,派生類會繼承基類的虛函式,也會復用基類放置虛表指標的記憶體位置,無論基類有沒有定義虛函式,有沒有新增虛函式,都不會增加新的虛表指標,而是復用基類的虛表指標的記憶體位置,
// test11.cpp
// 添加了:
// virtual char Base1::getChar();
// int Base1::getIntOfBase1();
// virtual char Base2::getShort();
// int Base2::getIntOfBase2();
// virtual int Derived::getInt();
#include <cstdio>
class Base1 {
public:
Base1(int i, char c)
:m_i(i), m_c(c)
{}
virtual
char getChar() const { return m_c; } // ! 添加
int getIntOfBase1() const { return m_i; } // ! 添加
private:
int m_i;
char m_c;
};
class Base2{
public:
Base2(short s, int i)
: m_s(s), m_i(i) {}
virtual
short getShort() const { return m_s; } // ! 添加
int getIntOfBase2() const { return m_i; } // ! 添加
private:
short m_s;
int m_i;
};
class Derived: public Base1, public Base2 {
public:
Derived(int i1, char c, short s, int i2, long l)
: Base1(i1, c), Base2(s, i2), m_l(l)
{}
virtual
long getLong() const { return m_l; }
virtual
int getInt() { return getIntOfBase2(); } // ! 添加
private:
long m_l;
};
int main() {
std::printf("sizeof Derived: %d\n", static_cast<int>(sizeof(Derived)));
Derived d(1, static_cast<char>(2), static_cast<short>(3), 4, static_cast<long>(5));
auto c = d.getChar();
auto s = d.getShort();
auto i = d.getInt();
}
// Output:
// sizeof Derived: 40
使用gdb除錯編譯出來的程式,如下:

我們可以看到只有兩個虛函式表,是繼承自Base1和Base2的,
我們再看一下這兩個虛函式表里面的內容:

可以看到Base1的虛表里面,Base1::vptr[0]為Base1::getChar()的地址,Base1::vptr[2]為Derived::getInt()的地址;在Base2的虛表里面,Base2::vptr[0]為Base2::getShort()的地址,
那Base1::vptr[1]是什么地址?我們現在還沒有看到Derived::getLong()這個虛函式,是它的地址嗎?查看該地址處的反匯編代碼可知,確實如此,

至此,我們可以總結在基類有虛函式的時候C++的記憶體布局了:派生類新增的虛函式并不會導致新的虛表指標的誕生,而是會復用第一個虛表指標,使其指向一個新的虛表,這個虛表前幾項都是基類的虛函式地址(當然,如果派生類覆寫[override]了該虛函式,新的虛函式地址會在該位置覆寫基類的虛函式地址),后面則是派生類的虛函式地址,
指標的調整
為了支持多型,C++支持將派生類的指標賦值給基類的指標,那C++是如何保證這個指標能正確索引到成員變數和成員函式的呢?
其實很簡單,在派生類中,有著完整的基類物件,包括基類的虛函式指標,而且虛函式表中的虛函式地址也已經被正確設定,因此只需要把指標調整到該基類對應的位置即可,如:
// file test12.cpp
#include <cstdio>
class Base1 {
public:
Base1(int i, char c)
:m_i(i), m_c(c)
{}
virtual
char getChar() const { return m_c; }
int getIntOfBase1() const { return m_i; }
private:
int m_i;
char m_c;
};
class Base2{
public:
Base2(short s, int i)
: m_s(s), m_i(i) {}
virtual
short getShort() const { return m_s; }
int getIntOfBase2() const { return m_i; }
private:
short m_s;
int m_i;
};
class Derived: public Base1, public Base2 {
public:
Derived(int i1, char c, short s, int i2, long l)
: Base1(i1, c), Base2(s, i2), m_l(l)
{}
virtual
long getLong() const { return m_l; }
virtual
int getInt() { return getIntOfBase2(); }
private:
long m_l;
};
int main() {
Derived d(1, static_cast<char>(2), static_cast<short>(3), 4, static_cast<long>(5));
Derived* pd = &d;
// Base1 在Derived類開頭,不需要調整指標
Base1* pb1 = pd;
// Base2 在Derived類0x10偏移處,
// pb2 = (pd == nullptr ? nullptr : pd + 0x10)
Base2* pb2 = pd;
}
反匯編正如注釋:

有虛繼承
按照《深度探索C++物件模型》的描述,對于有虛繼承的類,會有一個偏移量值表征當前指標與虛基類基址距離的偏移量,那么這個偏移量在哪里?在物件實體的記憶體布局中?還是在虛表里面?如果在虛表里面會不會添加新的虛表指標?還是繼續復用基類的虛表指標?
// test13.cpp
class Point2D {
public:
Point2D(int x, int y)
: m_x(x), m_y(y)
{}
virtual
int getX() const { return m_x; }
private:
int m_x;
int m_y;
};
class Point3D: virtual public Point2D {
public:
Point3D(int x, int y, int z)
: Point2D(x, y), m_z(z)
{}
virtual
int getZ() { return m_z; }
private:
int m_z;
};
class VertexInterface {
public:
virtual
VertexInterface* getNext() = 0;
};
class Vertex: virtual public Point2D, public VertexInterface {
public:
Vertex(int x, int y, Vertex* next)
: Point2D(x, y), m_next(next)
{}
virtual
Vertex* getNext() override { return m_next; }
private:
Vertex* m_next;
};
class Vertex3D: public Point3D, public Vertex {
public:
Vertex3D(int x, int y ,int z, int mumble)
: Point3D(x, y, z),
Vertex(x, y, nullptr),
Point2D(x, y),
m_mumble(mumble)
{}
virtual
long getMumble()
{ return m_mumble; }
private:
int m_mumble;
};
int main() {
Point3D p3d(1,2,3);
Point3D* pp3d = &p3d;
Point2D* pp2d = pp3d;
Vertex vex(1, 2, nullptr);
Vertex* next = vex.getNext();
Vertex3D v3d(1, 2, 3, 4);
Vertex3D* pv3d = &v3d;
Point2D* pp2d_1 = pv3d;
int mumble = v3d.getMumble();
}
派生類的所有非虛基類里都沒有虛表指標
對上面代碼生成的程式使用gdb進行除錯,

首先查看各個類物件的size,
我們可以看到,Point2D的size為16,這是可以預見的,虛表指標vptr占用8個位元組,兩個int型別的非static成員變數占用8個位元組,一共16個位元組,
而Point3D的size為32,虛基類Point2D的size為16,對齊要求為8,自己的一個int型別的非static成員變數占用4個位元組,如果沒有新添加東西,則加上對齊要求則只需要24位元組size,說明必然加了新的東西,要么是基類offset,要么是新的虛表指標,

可以看到虛基類Point2D被放在了offset0x10的位置,而Point3D::m_z在offset0x8,那在offset0x0的位置那里的是什么?可以確定不是虛基類的偏移,因為虛基類的偏移為0x10,那就應該是虛表指標了,那offset會在里面嗎?

可以看到在vptr[-3]處有一個0x10的值,那虛基類的偏移量會是在vptr[-3]處嗎?,我們看一下反匯編是如何對指標進行操作的,

可以看到匯編代碼也正是這樣做的,相當于:pp2d = (pp3d == nulltr ? nullptr : pp3d + vptr[-3]),其中vptr為位于Point3D開頭,保存虛基類的虛表指標,而不是虛基類Point2D的虛表指標.
也就是說虛基類的偏移量不會保存在物件的記憶體布局中,而是放在虛表中,而派生類不會復用虛基類的虛表指標(也應該這樣,虛基類都找不到怎么用它的虛表指標找偏移量),而且派生類的虛表指標和新成員變數是放在類的開頭的,并不是像沒有虛繼承那樣基類物件在最開頭(offset0x0的位置),
其實在《深度探索C++物件模型》中說的是虛基類的偏移放到了vptr[-1]的位置,但我們知道在g++的實作里這個位置給了該類對應的typeinfo物件,g++實際上將虛基類偏移量放在了vptr[-3],
派生類的非虛基類里都有虛表指標
那么如果派生類還繼承(非虛繼承)了其他有虛函式表指標的類,那么派生類會不會復用其虛表指標呢?類Vertex正是這樣,Point2D是它的虛基類,而VertexInterface是它的普通基類,類Point2D的size為16,VertexInterface的size為8(只包含一個虛表指標),Vertex還有自己的成員變數m_next,size為8,這樣就湊夠32個位元組了,說明Vertex沒有生成自己的虛表指標,會復用非虛基類的虛表指標,

從除錯結果來看,g++會在派生類的最前面按照生命順序放置非虛基類物件,然后放置派生類自己的成員,最后放置虛基類物件,
派生類繼承了擁有公共虛基類的兩個類
我們來算一下Vertex3D類里面的各個成員及其size,首先Point3D除了虛基類Point2D外還有16位元組(虛表指標8,int成員4,對齊4),Vertex除了虛基類Point2D外還有16位元組(VertexInterface的虛表指標8,Vertex*成員8),Vertex3D自己的int成員4位元組,最后虛基類Point2D的size為16,對齊為8,所以前面要填充4位元組一共16+16+4+4+16=56位元組,正好是Vertex3D類的大小,所以繼承有公共虛基類的兩個類不會增加虛表指標,而是直接復用基類的虛表指標,用gdb查看可以看到其記憶體布局正如上面所言,

所以,對于派生了繼承了有公共虛基類的兩個類,g++會將非虛基類的所有成員按宣告順序在記憶體中排列,再將派生類自己的成員放在記憶體里,最后就是虛基類,
最后,在使用分析類物件的時候,可以使用 p /x {objName}來查看物件內容和各個成員的值,我在寫這篇博客的時候就忘記對Vertex3D::m_mumble成員初始化,結果其是一個未初始化的值,而且我還我忘記了Vertex3D內還有這個成員,一直沒發現這個是什么值,不知道為什么出現了這未知的8位元組,使用p /x v3d命令后才發現是Vertex3D::m_mumble,浪費了很多時間,自己還有很多要提升的地方,gdb的這個用法來自《C++ 虛函式之一:物件記憶體布局》,最后給大家展示一下p /x v3d后的結果:
(gdb) p /x v3d
$2 = {<Point3D> = {<Point2D> = {_vptr.Point2D = 0x8201b70 <vtable for Vertex3D+96>, m_x = 0x1, m_y = 0x2}, _vptr.Point3D = 0x8201b28 <vtable for Vertex3D+24>,
m_z = 0x3}, <Vertex> = {<VertexInterface> = {_vptr.VertexInterface = 0x8201b50 <vtable for Vertex3D+64>}, m_next = 0x0}, m_mumble = 0x4}
《深度探索C++物件模型》里還有對于成員指標的講解,但這篇博文已經很長了,就放在下一篇總結吧,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/521766.html
標籤:C++
下一篇:[JSOI2010]連通數
