直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?予一人2020-01-31 23:38:32

這是一個好問題,而要真正理解這個問題,你首先需要在頭腦裡消除一種誤會:

{\rm d}x{\rm d}y,{\rm d}r{\rm d}\theta

這樣的記號並不代表通常意義上的乘法,因此不能按照通常的多項式乘法來處理。事實上,它們是所謂的

楔形積

(wedge product),相當於

外積。

嚴格來講,這記號應該寫作

{\rm d}x\wedge{\rm d}y,{\rm d}r\wedge{\rm d}\theta.

這種運算規定:

a \wedge b=-(b \wedge a),~~~ a \wedge a=0\\

於是

\mathrm{d}r\wedge\mathrm{d}r=0,\quad \mathrm{d}\theta\wedge\mathrm{d}r=-(\mathrm{d}r\wedge\mathrm{d}\theta),\quad \mathrm{d}\theta\wedge\mathrm{d}\theta=0\\

於是

\begin{align*} {\rm d}x\wedge{\rm d}y&={\rm d}(r\cos\theta)\wedge{\rm d}(r\sin\theta)\\&=(-r\sin\theta{\rm d}\theta+\cos\theta{\rm d}r)\wedge(r\cos\theta{\rm d}\theta+\sin\theta{\rm d}r)\\ &=-r\sin^2\theta ({\rm d}\theta \wedge{\rm d} r)+r\cos^2\theta ({\rm d}r \wedge{\rm d} \theta)\\ &=r\sin^2\theta ({\rm d}r \wedge{\rm d} \theta)+r\cos^2\theta ({\rm d}r \wedge{\rm d} \theta)\\  &=r(\sin^2 \theta+\cos^2 \theta) ({\rm d}r \wedge{\rm d} \theta)\\ &=r({\rm d} r\wedge{\rm d} \theta) \end{align*}\\

直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?知乎使用者uLp9f02020-01-31 23:50:08

dxdy寫在一起表示二重積分裡面的dσ,也就是所謂的面積元素,並不是表示是dx和dy相乘,所以用引數方程代入肯定不行的。這裡的dxdy實際上是微分的外積,記作dx^dy。

這裡簡單介紹一下微分外積的計算規則,這個外積滿足反對稱性,即dx^dy=-dy^dx,由反對稱性很容易推出dx^dx=0。

這裡x=rcosθ,y=rsinθ,所以dx=cosθdr-rsinθdθ,dy=sinθdr+rcosθdθ,所以dx^dy=(。。。。。)^(。。。。。),利用反對稱性,可得出dx^dy=rdr^dθ,可見從外微分形式的運演算法則同樣得出了利用雅可比行列式算出來的結果。

我們知道多元微積分有幾個著名的公式,分別是格林公式,斯托克公式,高斯公式,這三個公式都刻畫了在邊界上的積分與在內部積分的關係,還有一元微積分的牛頓萊布尼茲公式,透過微分的外積,可以統一成一個公式,稱為Stokes公式:∫(∂Σ)ω=∫(Σ)dω。括號內表示積分割槽域。

………………………………………………………………………

高贊回答下的評論提到外積算出來的那一套實際上是雅可比行列式展開的結果,這個說法其實也沒錯。外積的運演算法則為反對稱性,且對dx和dy保持線性。行列式也是這樣定義出來的,藍以中版本的高等代數就是這樣定義行列式的:1,行列式對行或列為線性,2,交換任意行或列的位置,行列式變號。可見行列式和外積的運演算法則是一致的,本質上是同一個東西。

直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?知乎使用者2020-02-03 08:36:04

先給個一句話回答:

因為 dx、dy 不是如同 42、69 那樣的數值,而是倆函式,它們之間的乘法也不是 42*69 那樣的乘法,而是一種函式之間的特殊運算,自然不能用普通乘法得到座標變換關係

要真正理解這個問題,題主需要學習一點流形上的微積分知識

——————前方巨多公式警告!———————

準備好了嗎?Let‘s go!

我們先不看有點複雜的二元積分,看看一元先

假設我們要計算汽車駛過一段路的油耗,函式 f(x) 代表在路點 x 處的單位里程油耗,總油耗可以寫作

\int f(x) \mathrm dx

,那麼這個積分式中的 dx 指的是什麼?

插幾句閒話:如何看待積分

\int f(x) \mathrm dx

這個形式記號?對於初學者,我們一般把它解釋為就是有限求和形式

\sum f(x_i) \Delta x_i

的無限細分版本;對於熟悉線代黑話的同學,積分形式也可看成 f(x) 與 dx 的配對;配對在數學裡可謂無處不在,參考問題 對偶對映的“對偶”體現在何處?

我們知道黎曼積分的本質是把積分割槽域分劃成許多小塊,對每個小塊計算 f 的貢獻,然後累積起來

這裡的小塊怎麼用數學語言來表達?

如果這個小塊對應起終點分別是

\vec a

\vec b

,那麼很自然的想法是用向量

\vec h = \vec b - \vec a

來表示

注意我這裡刻意避免用實數軸

\mathbb R

來表示路段,因為路點的自然表示應該是向量

\vec x

而不是公里里程數 x;後者只是為了方便計算而人為引入的座標化工具,我們既可以用公里數 x 也可以用英里數 y 來刻畫特定路點,但這都不影響積分結果,當然為了計算出這個結果最終還是要選定某一具體的座標化方案

現在小塊被抽象為向量

\vec h

,但是我們需要給出的是在該小塊上的油耗,這是一個標量,等於每公里油耗

f(\vec a)

乘以小塊長度 h(也以公里為單位),注意 h 不同於向量

\vec h

,是個標量

就是說我們需要一個轉換工具,一個喂進向量

\vec h

吐出標量 h 的函式:

\mathrm dx : \vec h \mapsto h \\

這裡

x

是座標函式,喂進路點

\vec a

吐出對應公里里程數 a:

x : \vec a \mapsto a \\

注意區分

\mathrm dx

x

:前者自變數是以特定路點為起點的向量,後者自變數則是路點自身

[1]

在一維情形下

\mathrm dx

這個函式很簡單,就是返回兩個路點的公里里程差而已:

\mathrm dx : \vec h \mapsto x(\vec a + \vec h) - x(\vec a) \\

要著重指出,

\mathrm dx

是向量空間上的線性函式,這對於確保積分

\int f(x) \mathrm dx

與積分割槽域分劃方案無關是必要的:因為

\mathrm dx

是對小塊 D 大小的一個量度 m(D),如果小塊 D 被進一步分劃成倆更小的小塊 D1、D2,我們自然要求 m(D)=m(D1)+m(D2),這樣兩次累加起來才會一致

如果我們改用英里里程來標記路點,即有座標函式

y

喂進路點

\vec a

吐出對應英里里程數 a’:

y : \vec a \mapsto a

自然的我們也有函式

\mathrm dy

,它返回的則是兩個路點的英里里程差:

\mathrm dy : \vec h \mapsto y(\vec a + \vec h) - y(\vec a) \\

兩個座標函式之間存在可逆的變換 x=x(y) 以及 y=y(x) ,給出對應同一路點兩種座標的轉換;相應的

\mathrm dx

\mathrm dy

之間也存在變換

\mathrm dx = x_y \mathrm dy

以及

\mathrm dy = y_x \mathrm dx

,給出對應同一向量兩種里程差的轉換(下標記號表示導數)

現在問題來了:這時總油耗用座標

y

應該怎麼表示?

注意 f 是每公里油耗,所以我們仍然需要將它乘以按公里量度的小塊大小,而不是直接乘以英里里程差

\mathrm dy (\vec h)

,換言之積分式應如下變換:

\int f(x) \mathrm dx = \int f(x(y)) \; x_y \mathrm dy \\

這就是說,用本地座標

y

量度的長度元

\mathrm dy

,必須乘以一個換算係數

x_y

來轉換成按標準座標

x

量度的長度元

\mathrm dx

,相當於做個單位換算

現在我們來討論二維的情形,比如計算給一塊牆面刷漆需要多少油漆

把牆面

\vec a

處附近單位面積需要的油漆記為

f(\vec a)

,總油漆量可以形式的寫成

\int f(\vec a) \; \mathrm dA

,這裡

\mathrm dA

即所謂面積元;那麼這個

\mathrm dA

在數學上究竟是什麼呢?面積是個數值,所以

\mathrm dA

似乎應該是個數?

讓我們回想一維情形,一維積分

\int f(x) \mathrm dx

是透過把積分割槽域分劃為小塊,對每個小塊 D 計算 f 的貢獻然後累加而來,而

\mathrm dx

的作用就是量度小塊 D 的大小 m(D),一維情形下這個大小就是長度

那麼自然我們也要把牆面分劃成一系列二維小塊,對每個小塊 D 計算 f 的貢獻,而

\mathrm dA

的作用應該就是量度小塊 D 的大小 m(D),這個大小自然就是面積,換言之

\mathrm dA

是個喂進二維圖形吐出該圖形面積的函式

對牆面最簡單的分劃方案自然是平行四邊形網格,這時每個小塊都是個平行四邊形,可以被兩條邊

\vec u

\vec v

所確定,於是我們把小塊抽象化為一對向量

(\vec u, \vec v)

,而

\mathrm dA

是個喂進一對向量吐出面積

w

的二元函式:

\mathrm dA : (\vec u,\vec v) \mapsto w \\

注意這裡

w

可以是負數,即我們談論的實際上是有向四邊形的面積;習慣規定當

(\vec u, \vec v)

構成右手系時對應的面積為正,構成左手系時面積為負,而當

\vec u=\vec v

時面積為 0 因為此時平行四邊形退化成一維線條了;在物理領域有向面積是極其常見的,比如電流、磁通量計算的都是透過有向面積的量,可正可負

還注意到面積作為大小的量度,自然要有連續性、可加性和平移不變性,由此經過一些簡單的幾何論證可得

\mathrm dA

對每個變元都是線性的(只寫出對第一個變元,對第二個變元是類似的):

\begin{align} \mathrm dA (\lambda\vec u, \vec v) &= \lambda\ \mathrm dA (\vec u, \vec v)\\ \mathrm dA (\vec u+\vec u

利用當兩向量相等時面積=0,可進一步證明

\mathrm dA

是反對稱的,這和前面說的有向四邊形定向法則也一致(若

(\vec u, \vec v)

構成右手系,則交換後

(\vec v, \vec u)

構成左手系,面積變為相反數):

\begin{align} 0 &= \mathrm dA (\vec u+\vec v,\ \vec u + \vec v) \\ &= \mathrm dA (\vec u, \vec u) + \mathrm dA (\vec v, \vec v) + \mathrm dA (\vec u, \vec v) + \mathrm dA (\vec v, \vec u) \\ &= \mathrm dA (\vec u, \vec v) + \mathrm dA (\vec v, \vec u) \\ \end{align} \\

注意劃重點了:

面積元

\mathrm dA

是個反對稱雙線性函式

以上是關於

\mathrm dA

的抽象性質,確定了

\mathrm dA

並不是個數而是個反對稱雙線性函式,我們還得給出這個函式在給定座標化方案時的具體形式,才能用於計算積分

先考慮最常用的直角座標系,我們有座標函式

x(\vec a)

y(\vec a)

,以及微分

\mathrm dx

\mathrm dy

,它們給出了起點在

\vec a

的向量

\vec u

的 x 分量

\mathrm dx (\vec u) = x(\vec a + \vec u) - x(\vec a)

和 y 分量

\mathrm dy (\vec u) = y(\vec a + \vec u) - y(\vec a)

將 x 分量為 1 而 y 分量為 0 的單位向量記作

\partial_x

,將 x 分量為 0 而 y 分量為 1 的單位向量記作

\partial_y

思考題 1:標記單位向量的另一種常見記號是

e_x

,我們為什麼舍之而用偏微分符號

\partial_x

那麼向量

\vec u

即可寫成分量的組合形式:

\vec u = \partial_x\ \mathrm dx (\vec u) + \partial_y\ \mathrm dy (\vec u) \\

於是

\mathrm dA

可展開如下(注意利用了反對稱和雙線性):

\begin{align} \mathrm dA(\vec u,\vec v) &= \mathrm dA(\partial_x\ \mathrm dx (\vec u) + \partial_y\ \mathrm dy (\vec u), \; \partial_x\ \mathrm dx (\vec v) + \partial_y\ \mathrm dy (\vec v)) \\ &= \mathrm dA(\partial_x, \partial_y)\  (\mathrm dx (\vec u) \mathrm dy (\vec v) - \mathrm dy (\vec u) \mathrm dx (\vec v)) \end{align} \\

其中

\mathrm dA(\partial_x, \partial_y)

是由單位向量

\partial_x

\partial_y

確定的正方形面積,習慣將其指定為 1

另外為方便起見,我們定義兩個一元函式 f 和 g 的張量積

f\otimes g

為如下二元函式

[2]

f\otimes g : (i,j) \mapsto f(i)g(j) \\

這樣二元函式

\mathrm dA

便是兩個一元函式

\mathrm dx

\mathrm dy

的反對稱張量積組合:

\mathrm dA = \mathrm dx \otimes \mathrm dy - \mathrm dy \otimes \mathrm dx = \mathrm dx \wedge \mathrm dy \\

因為這種反對稱張量積組合極其常見,我們專門給它起個名字叫做

外積

,以楔形符號

\wedge

表示(所以外積也叫楔積);容易知道外積運算也是雙線性的,且反交換

\mathrm dx \wedge \mathrm dy = -\ \mathrm dy \wedge \mathrm dx

思考題 2:我們還可以做出另一種張量積組合

\mathrm dx \otimes \mathrm dx + \mathrm dy \otimes \mathrm dy

,它具有什麼性質?對應幾何上的什麼構造?

這樣我們就知道了直角座標下二維積分應該寫成

\int f(x,y) \; \mathrm dx \wedge \mathrm dy

現在回到題主的問題,就能很清楚的看出不能用簡單的數值相乘來得到面積元變換公式,因為積分公式裡的 dxdy 壓根不是兩個數的相乘,而是函式dx與dy做外積

那麼可能有人會問:我們平時做二元積分似乎就是把 dxdy 當作普通乘積來算,也沒見鬧出啥么蛾子?

這是因為我們總是用平行於 X 軸和 Y 軸的平行線來劃網格,這種格的底邊

\vec u

只有 x 分量而無 y 分量

\mathrm dy (\vec u) = 0

,左邊

\vec v

只有 y 分量而無 x 分量

\mathrm dx (\vec v) = 0

,帶入面積元的一般形式就有:

\mathrm dx \wedge \mathrm dy\; (\vec u,\vec v)= \mathrm dx (\vec u) \mathrm dy (\vec v) - \mathrm dy (\vec u) \mathrm dx (\vec v) = \mathrm dx (\vec u) \mathrm dy (\vec v) \\

這樣當我們對所有小塊累積

f(x,y)\mathrm dx (\vec u) \mathrm dy (\vec v)

時,可以先固定 y 和

\mathrm dy (\vec v)

沿 X 軸累積

f(x,y)\mathrm dx (\vec u)

然後再沿 Y 軸累積,也就是逐次積分法

[3]

\iint f(x,y)\ \mathrm dx \wedge \mathrm dy = \int \left(\int f(x,y)\ \mathrm dx \right)\ \mathrm dy \\

可以看出在這種特定情形下外積

\mathrm dx \wedge \mathrm dy

確實顯得跟普通乘積一般

但是當我們打算換一種座標來計算同樣的積分時,就必須老老實實應用外積的一般形式了

直角座標和極座標之間有如下微分關係:

\begin{align} \mathrm dx = \cos \theta\ \mathrm dr - r \sin \theta\ \mathrm d\theta \\ \mathrm dy = \sin \theta\ \mathrm dr + r \cos \theta\ \mathrm d\theta  \end{align} \\

於是得到用極座標表達的面積元(注意運用前面講到的外積雙線性和反對稱性):

\begin{align} \mathrm dA  &= \mathrm dx \wedge \mathrm dy \\ &= (\cos \theta\ \mathrm dr - r \sin \theta\ \mathrm d\theta)  \wedge(\sin \theta\ \mathrm dr + r \cos \theta\ \mathrm d\theta) \\ &= r\ \mathrm dr \wedge \mathrm d\theta \end{align} \\

對於一般的座標 (s,t) ,對應的面積元為

\frac{\partial(x,y)}{\partial(s,t)} \mathrm ds \wedge \mathrm dt

,其中

\frac{\partial(x,y)}{\partial(s,t)}

是雅可比行列式:

\frac{\partial(x,y)}{\partial(s,t)} =  \begin{vmatrix} x_s & y_s \\ x_t & y_t \end{vmatrix} \\

如同一維情形,

\mathrm ds \wedge \mathrm dt

可以視為按本地座標量度的面積元,它必須乘以雅可比行列式來轉換成按標準座標量度的面積元

[4]

思考題 3:前面的講述一直限定在二維平面上,擴充套件到三維此時面積元應該是什麼?體積元呢?

思考題 4:有可能把積分定義擴充套件到無窮維嗎?

這裡澄清下 @chris 對我的誤解

直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?

我是非常贊同你的幾何直覺優先觀的,也非常喜歡老阿那本書,有回答為證,還為這被某阿黑大佬拉黑(ಥ _ ಥ)

為什麼微積分那麼難學?

只不過要真正回答題主這個問題,就必然要求對面積元的概念做深入探求,這自然就會導向外微分的概念,所以講外微分確實是正解,但必須理清它的來龍去脈,而不是簡單的丟出一坨古怪的運演算法則,告訴題主就是這麼規定的,這樣做看著很厲害其實只是搬書本,並不能真正解除題主的疑惑

直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?TravorLZH2020-02-03 21:09:25

對於積分

\iint\limits_Rf(x,y)dxdy

,進行如下變換

x=r\cos\theta \\y=r\sin\theta

這是一個典型的非線性變換。按照微積分的直覺,我們要把非線性的東西用線性來估計。所以人們發明了雅可比矩陣來用線性變換來估計非線性變換。則對應的雅可比矩陣為:

J=\begin{bmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{bmatrix}

這個矩陣的用法是大概是這樣滴:

\begin{bmatrix} x \\ y \end{bmatrix}=J \begin{bmatrix} \Delta r \\ \Delta\theta \end{bmatrix}+ \begin{bmatrix} x_0 \\ y_0 \end{bmatrix}

根據線性代數的知識,我們知道行列式是用來計算線性變換後圖形與原先圖形的面積比。對於非線性變換,我們可以透過把每個微小的dr和dθ對應的雅可比行列式與之相乘,用於近似dxdy

\det(J)=r\cos^2\theta+r\sin^2\theta=r

由於矩陣本身的特性,行列式有時為負數。但是由於我們是對面積積分,所以在算積分時取其絕對值。最終我們把變換帶入,得到:

\iint\limits_Rf(x,y)dxdy=\iint\limits_Df(r\cos\theta,r\sin\theta)\left|\det(J)\right|drd\theta=\iint_Df(r\cos\theta,r\sin\theta)rdrd\theta

因為雅可比行列式,dxdy最終的變換結果是rdrdθ

直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?半個馮博士2020-09-01 20:22:56

那就從頭開始考慮吧。

先畫一張圖

直角座標與極座標的互化中,為什麼 dxdy=rdrdθ?

圖中所示陰影部分就是我們要求的面積微元。圖中極角增加了微小的量

\Delta \theta

,極徑也變化了微小的量

\Delta r

,原動點

M_1

移動到了

M_3

圓弧

\stackrel{\frown}{M_1M_4}

​:半徑為

r

, 圓心在極點

O

圓弧

\stackrel{\frown}{M_2M_3}

:半徑為

r+\Delta r

, 圓心在極點

O

陰影部分的面積為大扇形的面積減去小扇形的面積,注意到扇形面積公式:

S=\frac{1}{2}r^2\cdot\theta

,因此:

大扇形:

S_{扇M_2OM_3}=\frac{1}{2}(r+\Delta r)^2\cdot\Delta\theta

小扇形:

S_{扇M_1OM_4}=\frac{1}{2}r^2\cdot\Delta\theta

由此可以得出圓環

M_1M_2M_3M_4

的面積:

\begin{align} S_{環}&=S_{扇M_2OM_3}-S_{扇M_1OM_4}\\ &=\frac{1}{2}(r+\Delta r)^2\cdot\Delta\theta-\frac{1}{2}r^2\cdot\Delta\theta \\ &= \frac{1}{2}(r^2+2r\Delta r +(\Delta r)^2-r^2)\cdot\Delta\theta \\ &= \frac{1}{2}(2r\Delta r +(\Delta r)^2)\cdot\Delta\theta  \end{align} \\

注意到這幾個問題:

d\theta \approx  \Delta\theta

(\Delta r)^2

2r\Delta r

的高階無窮小,因此可以忽略

dr\approx \Delta r

S_{環}

就是面積微元

d\sigma

因此上述公式就可以簡化為:

\color{Blue}{ S_{環}=d\sigma=\frac{1}{2}(2r\Delta r)\cdot\Delta\theta=r\cdot dr d\theta} \tag{D-1}

明確這個簡單的過程之後,就很容易記住這個公式了。

上述內容裡面有兩個點一開始可能不好理解:

dr\approx \Delta r

和忽略

(\Delta r)^2

。其實這個問題也很簡單,不外乎等價無窮小的應用。

1、由於

\Delta r=d r+o(\Delta r)

,因此

\Delta r\sim dr

;同理

d\theta \sim\Delta\theta

2、注意到

 r\Delta r\Delta\theta+\frac{1}{2}(\Delta r)^2\Delta\theta = r\Delta r\Delta\theta+\operatorname{o}(r\Delta r\Delta\theta)

,那麼

 r\Delta r\Delta\theta+\frac{1}{2}(\Delta r)^2\Delta\theta \sim r\Delta r\Delta\theta)

認識到這兩點再考察二重積分的定義式:

\iint_{D} f(x, y) \mathrm{d} \sigma=\lim _{\lambda \rightarrow 0} \sum_{i=1}^{n} f\left(\xi_{i}, \eta_{i}\right) \Delta \sigma_{i} \tag{D-2}

注意這裡二重積分只要存在那麼右端極限就存在,這和極座標的處理沒有關係。於是我們可以考慮將面積微元的完整式子寫進來:

\lim _{\lambda \rightarrow 0} \sum_{i=1}^{n} f\left(\xi_{i}, \eta_{i}\right) \Delta \sigma_{i}  = \lim _{\lambda \rightarrow 0} \sum_{i=1}^{n} f\left(\xi_{i}, \eta_{i}\right) \color{Red}{\left (  r_i\Delta r_i\Delta\theta_i +\frac{1}{2}(\Delta r_i)^2\Delta\theta_i\right )} \\

這時如果使用等價無窮小的替換,是對

整個括號部分

進行替換,是滿足替換條件的。從而得到:

如果這個極限存在:

\iint_{D} f(x, y) \mathrm{d} \sigma=\lim _{\lambda \rightarrow 0} \sum_{i=1}^{n} f\left(\xi_{i}, \eta_{i}\right) \Delta \sigma_{i}  = \lim _{\lambda \rightarrow 0} \sum_{i=1}^{n} f\left(\xi_{i}, \eta_{i}\right) \left (  r_i\Delta r_i\Delta\theta_i \right ) \\

多謝評論區 @王雲峰 指點。