Fizyka wykłady

Spis treści

1. Wprowadzenie 1-1

1.1 Istota Fizyki 1-1

1.2 Pojęcia podstawowe 1-2

1.3 Jednostki 1-2

1.4 Matematyka w Fizyce 1-3

1.4.1 Modele matematyczne w fizyce 1-3

1.4.2 Analiza wymiarowa 1-4

1.4.3 Formalizm matematyczny 1-4

2. Ruch jednowymiarowy 2-1

2.1 Prędkość 2-1

2.1.1 Prędkość stała 2-1

2.1.2 Prędkość chwilowa 2-1

2.1.3 Prędkość średnia 2-2

2.2 Przyspieszenie 2-3

2.2.1 Przyspieszenie jednostajne i chwilowe 2-3

2.2.2 Ruch jednostajnie zmienny 2-3

3. Ruch na płaszczyźnie 3-1

3.1 Przemieszczenie, prędkość i przyspieszenie 3-1

3.2 Rzut ukośny 3-2

3.3 Ruch jednostajny po okręgu 3-4

4. Dynamika punktu materialnego 4-1

4.1 Wstęp 4-1

4.2 Definicje 4-1

4.2.1 Masa 4-1

4.2.2 Pęd 4-2

4.2.3 Siła 4-2

4.3 Zasady dynamiki Newtona 4-2

4.3.1 Pierwsza zasada dynamiki Newtona 4-3

4.3.2 Druga zasada dynamiki Newtona 4-3

4.3.3 Trzecia zasada dynamiki Newtona 4-4

5. Dynamika punktu materialnego II 5-1

5.1 Siły kontaktowe i tarcie 5-1

5.1.1 Siły kontaktowe 5-1

5.1.2 Tarcie 5-1

5.2 Siły bezwładności 5-2

6. Ciążenie powszechne (grawitacja) 6-1

6.1 Prawo powszechnego ciążenia 6-1

6.2 Doświadczenie Cavendisha 6-3

6.2.1 Ważenie Ziemi 6-4

6.3 Prawa Keplera ruchu planet 6-5

6.4 Ciężar 6-6

6.4.1 Ciężar pozorny, masa bezwładna i masa grawitacyjna 6-6

6.5 Pole grawitacyjne 6-7

6.5.1 Pole grawitacyjne wewnątrz kuli 6-8

7. Praca i energia 7-1

7.1 Wstęp 7-1

7.2 Praca wykonana przez stałą siłę 7-1

7.3 Praca wykonana przez siłę zmienną 7-3

7.4 Energia kinetyczna i twierdzenie o pracy i energii 7-5

7.5 Moc 7-6

8. Zasada zachowania energii 8-1

8.1 Wstęp 8-1

8.2 Siły zachowawcze i niezachowawcze 8-1

8.3 Energia potencjalna 8-3

8.3.1 Energia potencjalna i potencjał pola grawitacyjnego 8-5

8.4 Zasada zachowania energii 8-7

9. Zasada zachowania pędu 9-1

9.1 Środek masy 9-1

9.2 Ruch środka masy 9-3

9.3 Pęd układu punktów materialnych 9-5

9.4 Zasada zachowania pędu 9-6

10. Zasada zachowania pędu II 10-1

10.1 Układy o zmiennej masie 10-1

10.2 Zderzenia 10-2

10.2.1 Wstęp 10-2

10.1.2 Zderzenia w przestrzeni jednowymiarowej 10-3

11. Elementy szczególnej teorii względności 11-1

11.1 Wstęp 11-1

11.1.1 Zasada względności 11-1

11.1.2 Transformacja Galileusza 11-1

11.1.3 Dylatacja czasu 11-3

11.2 Transformacja Lorentza 11-5

11.2.1 Jednoczesność 11-5

11.2.2 Skrócenie długości 11-6

11.2.3 Stałość przedziału czasoprzestrzennego 11-6

11.2.4 Dodawanie prędkości 11-7

11.2.5 Zależność masy od prędkości 11-8

11.2.6 Równoważność masy i energii 11-9

12. Ruch obrotowy 12-1

12.1 Wstęp 12-1

12.2 Kinematyka ruchu obrotowego 12-1

12.3 Dynamika ruchu obrotowego 12-2

12.3.1 Moment siły 12-2

12.3.2 Moment pędu 12-2

12.3.3 Zachowanie momentu pędu 12-3

12.4 Ciała sztywne i moment bezwładności 12-5

12.5 Ruch postępowo-obrotowy ciała sztywnego 12-6

12.6 Ruch precesyjny (bąk) 12-8

13. Ruch drgający 13-1

13.1 Siła harmoniczna 13-1

13.2 Okres drgań 13-2

13.3 Wahadła 13-3

13.3.1 Wahadło proste 13-3

13.3.2 Wahadło fizyczne 13-4

13.4 Energia ruchu harmonicznego prostego 13-5

13.5 Oscylator harmoniczny tłumiony 13-7

13.5.1 Straty mocy, współczynnik dobroci 13-9

13.6 Drgania wymuszone oscylatora harmonicznego 13-9

13.6.1 Rezonans 13-11

13.6.2 Moc absorbowana 13-12

14. Statyka i dynamika płynów 14-1

14.1 Ciśnienie i gęstość 14-1

14.2 Zmiany ciśnienia wewnątrz nieruchomego płynu 14-2

14.3 Prawo Pascala i prawo Archimedesa 14-3

14.4 Pomiar ciśnienia (barometr) 14-4

14.5 Ogólny opis przepływu płynów 14-4

14.6 Równanie Bernoulliego 14-6

14.6.1 Dynamiczna siła nośna 14-7

15. Fale w ośrodkach sprężystych 15-1

15.1 Fale mechaniczne 15-1

15.2 Fale rozchodzące się w przestrzeni 15-1

15.3 Rozchodzenie się fal, prędkość fal 15-3

15.4 Przenoszenie energii przez fale 15-4

15.5 Interferencja fal 15-5

15.6 Fale stojące 15-6

15.6.1 Układy drgające, przykład 15-6

15.7 Dudnienia ‑ modulacja amplitudy 15-7

15.8 Zjawisko Dopplera 15-8

16. Kinetyczna teoria gazów i termodynamika I 16-1

16.1 Prawo gazów doskonałych 16-1

16.2 Temperatura 16-2

16.1.1 Termometry 16-3

16.3 Ekwipartycja energii 16-3

16.3.1 Zerowa zasada termodynamiki 16-3

16.3.2 Ekwipartycja energii 16-3

16.4 Pierwsza zasada termodynamiki 16-4

16.5 Ciepło właściwe 16-5

16.5.1 Ciepło właściwe przy stałej objętości 16-5

16.1.2 Ciepło właściwe przy stałym ciśnieniu 16-6

16.6 Rozprężanie izotermiczne 16-7

16.7 Rozprężanie adiabatyczne 16-7

17. Kinetyczna teoria gazów i termodynamika II 17-1

17.1 Średnia droga swobodna 17-1

17.2 Rozkład prędkości Maxwella 17-2

17.3 Równanie Van der Waalsa 17-3

17.4 Entropia i druga zasada termodynamiki 17-4

17.4.1 Procesy odwracalne i nieodwracalne 17-4

17.4.2 Cykl Carnota 17-4

17.4.3 Druga zasada termodynamiki 17-5

17.4.4 Termodynamiczna skala temperatur 17-6

17.4.5 Entropia 17-6

17.5 Stan równowagi, zjawiska transportu 17-9

17.5.1 Stan równowagi 17-9

17.5.2 Zjawiska transportu 17-10

18. Siła elektrostatyczna 18-1

18.1 Wstęp 18-1

18.2 Ładunek elektryczny 18-1

18.2.1 Kwantyzacja ładunku 18-1

18.2.2 Zachowanie ładunku 18-1

18.3 Prawo Coulomba 18-1

18.3.1 Zasada superpozycji 18-1

18.4 Pole elektryczne 18-2

18.4.1 Linie sił 18-3

18.5 Prawo Gaussa. 18-4

19. Elektrostatyka I 19-1

19.1 Wstęp 19-1

19.2 Kuliste rozkłady ładunków 19-1

19.2.1 Jednorodnie naładowana sfera 19-1

19.2.2 Jednorodnie naładowana kula 19-2

19.2.3 Liniowe rozkłady ładunków 19-3

19.2.4 Płaskie rozkłady ładunków 19-4

19.2.5 Powierzchnia przewodnika 19-5

19.3 Potencjał elektryczny 19-5

20. Elektrostatyka II 20-1

20.1 Obliczanie potencjału 20-1

20.2 Pojemność 20-2

20.3 Energia pola elektrycznego 20-2

20.4 Dielektryki 20-3

20.4.1 Dielektryki, pogląd atomistyczny 20-3

20.1.2 Dielektryki - rozważania ilościowe. 20-5

20.5 Trzy wektory elektryczne 20-6

21. Prąd elektryczny i pole magnetyczne 21-1

21.1 Prąd elektryczny 21-1

21.2 Prawo Ohma 21-2

21.2.1 Wyprowadzenie prawa Ohma 21-2

21.3 Straty cieplne 21-4

21.3.1 Siła elektromotoryczna 21-4

21.4 Obwody prądu stałego 21-5

21.4.1 Prawa Kirchoffa 21-5

21.5 Pole magnetyczne 21-6

21.5.1 Siła magnetyczna 21-6

21.5.2 Działanie pola magnetycznego na obwód z prądem 21-7

21.5.3 Efekt Halla 21-9

22. Pole magnetyczne, indukcja elektromagnetyczna 22-1

22.1 Prawo Ampera 22-1

22.2 Strumień magnetyczny 22-2

22.3 Przykładowe rozkłady prądów 22-2

22.3.1 Pręt (przewodnik) 22-2

22.3.2 Cewka (solenoid) 22-3

22.3.3 Dwa przewodniki równoległe 22-4

22.4 Prawo Biota-Savarta 22-4

22.5 Indukcja elektromagnetyczna 22-6

22.5.1 Prawo Faradaya 22-6

22.5.2 Reguła Lenza 22-6

23. Indukcja elektromagnetyczna, energia pola magnetycznego 23-1

23.1 Indukcyjność 23-1

23.1.1 Transformator 23-1

23.1.2 Indukcyjność własna 23-1

23.1.3 Indukcja wzajemna 23-2

23.2 Obwody RC i RL, stałe czasowe 23-3

23.2.1 Obwód RC 23-3

23.2.2 Obwód RL 23-4

23.3 Energia a pole magnetyczne 23-6

23.4 Gęstość energii a pole magnetyczne 23-6

24. Drgania elektromagnetyczne 24-1

24.1 Wstęp 24-1

24.2 Obwód LC 24-1

24.3 Obwód szeregowy RLC 24-2

24.3.1 Rezonans 24-5

24.4Moc w obwodzie prądu zmiennego 24-6

25. Równania Maxwella 25-1

25.1 Podstawowe równania elektromagnetyzmu 25-1

25.2 Indukowane pole magnetyczne 25-2

25.3 Prąd przesunięcia 25-4

25.4 Równania Maxwella 25-5

26. Fale elektromagnetyczne 26-1

26.1 Równanie falowe 26-1

26.2 Linie transmisyjne 26-1

26.2.1 Kabel koncentryczny 26-2

26.2.2 Pola i prądy w kablu koncentrycznym 26-3

26.2.3 Falowód 26-4

26.3 Wnęki rezonansowe 26-4

26.4 Promieniowanie 26-6

26.5 Wektor Poyntinga 26-7

27. Optyka geometryczna i falowa 27-1

27.1 Wstęp 27-1

27.1.1 Odbicie i załamanie 27-1

27.1.2 Zasada Fermata 27-1

27.2 Warunki stosowalności optyki geometrycznej 27-4

27.1.1 Zasada Huyghensa 27-5

28. Interferencja 28-1

28.1 Doświadczenie Younga 28-1

28.2 Koherencja 28-4

28.3 Natężenie w doświadczeniu Younga 28-4

28.4 Interferencja w cienkich błonkach 28-7

29. Dyfrakcja 29-1

29.1 Pojedyncza szczelina 29-2

29.2 Pojedyncza szczelina, rozważania jakościowe 29-4

29.3 Pojedyncza szczelina, rozważania ilościowe 29-5

29.4 Równoczesna interferencja i dyfrakcja na dwóch szczelinach 29-7

30. Siatki dyfrakcyjne 30-1

30.1 Siatki dyfrakcyjne 30-1

30.2 Dyfrakcja promieni Roentgena (promieni X) 30-3

30.3 Prawo Bragga 30-5

31. Polaryzacja 31-1

31.1 Płytki polaryzujące 31-2

31.2 Polaryzacja przez odbicie 31-4

31.3 Załamanie podwójne 31-5

32. Światło a fizyka kwantowa 32-1

32.1 Źródła światła 32-1

32.2 Ciało doskonale czarne 32-2

32.3 Teoria promieniowania we wnęce, prawo Plancka 32-4

32.3.1 Rozważania klasyczne 32-4

32.3.2 Teoria Plancka promieniowania ciała doskonale czarnego 32-5

32.3.3 Zastosowanie prawa promieniowania w termometrii 32-6

32.4 Zjawisko fotoelektryczne 32-7

32.5 Efekt Comptona 32-10

33. Model atomu Bohra 33-1

33.1 Wstęp 33-1

33.2 Widma atomowe 33-2

33.3 Model Bohra atomu wodoru 33-3

34. Fale i cząstki 34-1

34.1 Fale materii 34-1

34.2 Struktura atomu i fale stojące 34-3

34.3 Mechanika falowa 34-4

34.4 Znaczenie funkcji ψ 34-6

34.5 Zasada odpowiedniości 34-7

34.6 Zasada nieoznaczoności 34-8

35. Lasery 35-1

35.1 Emisja spontaniczna 35-1

35.2 Absorpcja 35-1

35.3 Emisja wymuszona 35-1

35.4 Rozkład Boltzmana 35-2

35.5 Laser 35-5

36. Atomy wieloelektronowe, układ okresowy pierwiastków. 36-1

36.1 Liczby kwantowe 36-1

36.2 Zasada Pauliego 36-2

36.2.1 Spin elektronu 36-2

36.3 Atomy wieloelektronowe, układ okresowy pierwiastków 36-3

36.4 Promienie X 36-5

37. Materia skondensowana 37-1

37.1 Wstęp 37-1

37.2 Rodzaje kryształów (rodzaje wiązań) 37-1

37.2.1 Kryształy cząsteczkowe 37-1

37.2.2 Kryształy o wiązaniach wodorowych 37-2

37.2.3 Kryształy jonowe 37-2

37.2.4 Kryształy atomowe (kowalentne) 37-2

37.2.5 Ciała metaliczne 37-2

37.3 Pasma energetyczne 37-3

37.4 Fizyka półprzewodników 37-5

37.4.1 Domieszkowanie półprzewodników 37-5

37.5 Zastosowania półprzewodników 37-6

37.5.1 Termistor 37-6

37.5.2 Złącze p - n 37-6

37.5.3 Baterie słoneczne 37-7

37.5.4 Fotodiody 37-7

37.5.5 Diody świecące 37-7

37.5.6 Tranzystor 37-7

37.5.7 Inne urządzenia 37-8

37.6 Własności magnetyczne ciał stałych 37-8

37.6.1 Diamagnetyzm 37-9

37.6.2 Paramagnetyzm 37-9

37.6.3 Ferromagnetyzm 37-10

38. Fizyka jądrowa 38-1

38.1 Wstęp 38-1

38.2 Rozmiary jąder 38-1

38.3 Oddziaływanie nukleon-nukleon 38-2

38.4 Rozpady jądrowe i reakcje jądrowe 38-4

38.4.1 Rozpad alfa 38-4

38.1.2 Promieniowanie γ 38-6

38.1.3 Rozpad β 38-6

38.1.4 Rozszczepienie jąder atomowych 38-7

38.1.5 Reakcja syntezy jądrowej 38-8

38.5 Cykl życia słońca 38-9

38.5.1 Chmura 38-9

38.5.2 Globule 38-9

38.5.3 Protogwiazda 38-10

38.1.4 Słońce 38-10

38.1.5 Czerwony olbrzym 38-12

38.1.6 Białe karły 38-12

38.1.7 Czarne karły 38-12

38.1.8 Gwiazda neutronowa 38-13

38.1.9 Czarna dziura 38-13

Wykład 1

Wprowadzenie

Istota Fizyki

Główny cel - poszukiwanie i poznawanie podstawowych praw przyrody, od których zależą wszystkie zjawiska fizyczne.

Historia nauki ‑ coraz głębsze poziomy pojmowania ale podstawowe prawa oraz teorie na kolejnych poziomach coraz prostsze i coraz ich mniej.

Przykład 1 jak przebiegał rozwój nauki o elektryczności i magnetyzmie, która ma tak fundamentalne znaczenie dla nas dzisiaj (elektronika, telekomunikacja, energetyka, informatyka itd.)?

  1. Już w starożytności wiedziano o oddziaływaniu ciał naelektryzowanych (potarty bursztyn przyciągał kawałki materii) i namagnesowanych (bryła magnetytu przyciągająca drobne kawałki żelaza).

  2. Dopiero w XVII wieku pierwsze pomiary ilościowe i pierwsze prawa fizyczne (prawo Coulomba).

  3. XIX wiek - oddziaływanie prądu z igłą magnetyczną (Oersted), oddziaływanie przewodników z prądem (Ampere), indukcja elektromagnetyczna (Faraday), prawo Ohma i w końcu jednolita teoria zjawisk elektromagnetycznych (prawa Maxwella.

Prawa Maxwella ("tylko" cztery!!!) są prawami ogólnymi, które zawierają w sobie jako przypadki szczególne nie tylko wszystkie prawa elektryczności i magnetyzmu, ale także wyjaśniają właściwości światła jako fali elektromagnetycznej.

Nie ulega wątpliwości, że zjawiskami przyrody rządzi stosunkowo niewielka liczba praw ogólnych. Celem fizyki jest właśnie poznanie tych praw.

Konsekwentnie, prawa fizyki będą wyprowadzane (gdzie to tylko możliwe) z podstawowych zasad, tj. będzie podkreślona różnica pomiędzy zasadami podstawowymi a tym co można z nich wyprowadzić.

Badania podstawowe - cząstki elementarne ich właściwości i oddziaływania.

Jak dotychczas stwierdzono tylko cztery podstawowe oddziaływania, z których wynikają wszystkie siły i oddziaływania zaobserwowane we Wszechświecie.

Tab. 1.1 Cztery podstawowe oddziaływania.

Typ oddziaływań Źródło Względne natężenie Zasięg

Grawitacyjne

Słabe

Elektromagnetyczne

Jądrowe

Masa

Wszystkie cząstki elementarne

Ładunek elektryczny

Hadrony (protony,neutrony,mezony)

~ 10-38

~ 10-15

~ 10-2

1

Długi

Krótki (10-18m)

Długi

Krótki (10-15m)

Podstawowy charakter cząstek elementarnych i ich oddziaływań przejawia się np. w tym, że objaśniają one zarówno świat małych jak i dużych wielkości (gwiazdy, galaktyki).

Wszystkie działy nauk fizycznych i biologicznych mają swe korzenie w fizyce.

Pojęcia podstawowe

Tak jak w każdej dyscyplinie, w fizyce posługujemy się specyficznymi pojęciami podstawowymi do opisu wielkości fizycznych czy też właściwości fizycznych obiektów. Pojęcia fizyczne definiujemy stosując pewne prawa fizyki. Bez zrozumienia tych pojęć nie jest możliwe opisanie zjawisk fizycznych i posługiwanie się tym opisem (modelami).

Jednostki

Fizyka w znacznej mierze zajmuje się pomiarami wielkości fizycznych, mających cechy ilościowe. Dlatego tak istotne jest podanie obok wielkości numerycznej (liczby) także jednostki. Dotyczy to również rozwiązań zadań z fizyki (uwaga do ćwiczeń). Nie wolno podawać odpowiedzi numerycznej nie podając jednocześnie jednostki.

Podstawowe jednostki - wiele wielkości fizycznych jest współzależnych. Np. prędkość jest długością podzieloną przez czas, gęstość masą podzieloną przez objętość itd.

Większość wielkości fizycznych jest związana z długością (l), czasem (t) i masą (m). Oznacza to, że te podstawowe wielkości wyznaczają wymiar innych wielkości fizycznych. Tak więc prędkość ma wymiar l/t (lt-1) a gęstość m/l3 (ml-3).

Zdecydowanie najpowszechniejszy jest układ metryczny. Bardzo prosta w tym układzie jest konwersja do innych jednostek. Po prostu dodaje się przedrostek określający odpowiednią potęgę dziesięciu (patrz Tab 1.2).

Tab. 1.2 Przedrostki jednostek metrycznych.

Przedrostek Skrót Potęga dziesięciu

tetra

giga

mega

kilo

centy

mili

mikro

nano

piko

femto

T

G

M

k

c

m

µ

n

p

f

1012

109

106

103

10-2

10-3

10-6

10-9

10-12

10-15

Długość, pole powierzchni, objętość są zdefiniowane w geometrii Euklidesowej.

Definicje 1 metra (historycznie):

  1. część (1/107) odległości od bieguna do równika,

  2. odległość między rysami na sztabie platynowej (Międzynarodowe Biuro Miar i Wag w Sevres, Francja),

  3. w oparciu o długość fal pewnej linii widmowej kryptonu 86Kr.

  4. jako droga, którą w próżni przebywa światło w czasie 1/299792458 sekundy.

Czas - jest pojęciem fizycznym, jego definicja jest związana z pewnymi prawami fizyki. Np. prawa fizyki mówią, że (a) okres obrotu Ziemi musi być z dużą dokładnością stały; (b) okres drgań oscylatora krystalicznego (zegarek, zegar komputera) jest stały przy stałych warunkach zewnętrznych takich jak np. temperatura. Obecnie najdokładniejsze zegary zliczają drgania promieniowania emitowanego przez atomy izotopu cezu 133Cs. Sekundę definiuje się jako czas trwania 919263177⋅109 drgań promieniowania emitowanego przez 133Cs.

Masa - również pojęcie fizyczne zdefiniowane przez pewne prawa fizyki. Nowoczesna definicja masy (w oparciu o prawo zachowania pędu) będzie podana w kolejnych wykładach. Obecnie światowym wzorcem kilograma (kg) jest walec platynowo-irydowy (Międzynarodowe Biuro Miar i Wag w Sevres, Francja),

Kiedy takie pojęcia jak czas czy masa opieramy na prawach fizyki, nie możemy być pewni, że te prawa są absolutnie poprawne. Teoria fizyczna w ostateczności spoczywa na fundamentach doświadczalnych, gdyż fizyka zajmuje się światem fizycznym. To właśnie obserwacje doświadczalne stwierdzające pewne prawidłowości (jeżeli spełnione są dane warunki to wynik doświadczenia się powtarza) leżą u podstaw formułowania praw przyrody. Doświadczenie weryfikuje więc teorię ale tylko w sensie negatywnym tj. może spowodować odrzucenie teorii. Nie może potwierdzić "całkowicie" teorii ze względu na ograniczone możliwości pomiarowe. Innymi słowy nie można wykluczyć sytuacji, że teoria nie przejdzie kolejnego testu doświadczalnego.

Trzeba powiedzieć, że takich teorii (tzw. wielkich teorii), które przewidują w szerokim zakresie i z bardzo dużą dokładnością wyniki doświadczeń jest niewiele np. mechanika klasyczna Newtona, teoria względności Einsteina. Inne przykłady spoza fizyki to geometria Euklidesowa i teoria Darwina. Do takiej teorii pretenduje również mechanika kwantowa.

Matematyka w fizyce

Modele matematyczne w fizyce

W fizyce wyniki badań podaje się w postaci liczb i praw wyrażonych matematycznie. Matematyka jest więc językiem fizyki, bez użycia matematyki nie można opisać zjawisk fizycznych ani z teoretycznego ani z doświadczalnego punktu widzenia (opis jakościowy, opis ilościowy). Matematyka stanowi narzędzie w pracy badawczej i służy do formułowania modeli matematycznych.

Stykając się z określoną sytuacją fizyczną fizyk stara się dokonywać jej idealizacji matematycznej czy, jak mówimy, symulacji, sporządzając wyidealizowany model matematyczny tej sytuacji według poniższego schematu

Idealizacja polega na przyjęciu założeń upraszczających np. dla wahadła złożonego z kulki zawieszonej na nici:

  1. przyjmujemy, że wahadło waha się w jednej płaszczyźnie,

  2. pomijamy opór powietrza,

  3. zaniedbujemy tarcie w punkcie zawieszenia,

  4. zaniedbujemy masę nici,

  5. zakładamy, że nić jest nierozciągliwa,

  6. zakładamy, że cała masa kulki jest skupiona w jednym punkcie w jej środku masy.

Rozważania dotyczące metod badań fizycznych i modeli zilustrujemy prostym przykładem: badanie siły oporu powietrza Foporu działającej na poruszający się samochód. Najpierw, jak wygląda metoda indukcyjna. Badacz analizujący ruch samochodu ustala najpierw wielkości fizyczne: prędkość samochodu, gęstość powietrza itd. Następnie stawia hipotezę, że siła oporu powietrza zależy od prędkości v (porównanie z jazdą na rowerze), od gęstości powietrza ρ (ośrodka) i od powierzchni pola przekroju S. Doświadczalnie sprawdza tę hipotezę. Okazuje się, że dla różnych v, ρ, S otrzymuje się różne wartości oporu powietrza. Teraz badacz buduje model matematyczny badanego zjawiska przyjmując, że pomiędzy badanymi wielkościami istnieje zależność funkcyjna: Foporu = f(v, ρ, A). Celem jest znalezienie (dopasowanie) tej funkcji. Można to zrobić na wiele sposobów. Poniżej, omówimy jeden prosty i skuteczny sposób tzw. analizę wymiarową.

Analiza wymiarowa

To postępowanie polega, w pierwszym kroku, na sformułowaniu uogólnionego związku

Foporu ~ Ax ρy vz

gdzie x, y, z są nieznanymi wykładnikami potęgi. Teraz sprawdzamy wymiar po obu stronach równania. Wyrażamy wymiar przez podstawowe wielkości: masę, długość i czas. Otrzymujemy

mlt-2 = (l2)x·(ml-3)y·(lt-1)z

Z przyrównania wykładników otrzymujemy

y = 1 (przy m)
2x-3y+z = 1 (przy l)
-z = -2 (przy t)

Rozwiązaniem są x = 1, y = 1, z = 2.

Wstawiając to do równania wyjściowego otrzymujemy

Foporu ~ Aρv2

Okazuje się, że to równanie jest poprawne z dokładnością do czynnika 1/2 (stała proporcjonalności). Stałą tę można wyznaczyć z wyników doświadczalnych.

Formalizm matematyczny

Uważa się, że fizyka posługuje się trudną matematyką wyższą. Tak nie jest gdy chodzi o podstawowe prawa. W większości będziemy używać prostej algebry, geometrii i trochę trygonometrii. Wprowadzimy elementy rachunku różniczkowego i całkowego ale w ograniczonym zakresie. Na wstępie kilka uwag (inne w trakcie wykładów).

skalary i wektory

Uwaga: Stosowane w tekście oznaczenia wektorów a i są równoważne

  1. Dodawanie wektorów, metoda geometryczna

  2. rozkładanie wektorów na składowe i dodawanie wektorów, metoda analityczna

składowe: ax = a cosθ; ay = a sinθ

długość:

wektor:

analogicznie: ,

dodawanie wektorów

c = a + b

cx = ax + bx cy = ay + by

  1. Mnożenie wektorów

skalarne: iloczyn dwóch wektorów jest skalarem (liczbą)

gdzie θ jest kątem pomiędzy wektorami a, b.

wektorowe:

długość wektora c:

c = ab sinθ

gdzie θ jest kątem pomiędzy wektorami a, b

Kierunek wektora c jest prostopadły do płaszczyzny utworzonej przez wektory a i b, tzn. prostopadły do tych wektorów. Zwrot wektora c wyznacza reguła śruby prawoskrętnej (rysunek poniżej)

  1. Funkcje i liczby (wartości stałe, zmienne, wartości chwilowe)

  2. Zapis formalny ;wielkości >> 1 i znacznie << 1 konieczność zapisu wykładniczego np. masa elektronu 9.1·10-31 kg. Korzystne jest to, że przy mnożeniu wykładniki dodaje się.

  3. Reprezentacja graficzna (wykresy)

  4. Cyfry znaczące w obliczeniach

Przykład 2

Pomiar prędkości: mierzymy drogę linijką z dokładnością 1%, oraz czas zegarem z dokładnością 0.01%. Wyniki pomiarów s = 1 m, t = 3 s, więc

v = s/t = 1/3 = 0.3333333 m/s

Pytanie: ile cyfr po znaku dziesiętnym ?

Umowa: przedostatnia podana cyfra jest uważana za pewną. Ponieważ odległość zmierzona z dokładnością 1% (pomiar czasu bardziej dokładny) więc wynik powinien być podany jako

v = 0.333 ± 0.003 m/s

Oznacza to, że wartość v leży w przedziale między 0.330 a 0.336 m/s. Widać, że dwie pierwsze trójki są pewne a trzecia jest nieco niepewna. Nie należy podawać wyniku w postaci v = 0.3 m/s ani v = 0.3333 m/s bo jest to mylące i niepotrzebne.

Podstawowe podręczniki:

D. Halliday, R. Resnick, Fizyka, t.I i II, PWN, Warszawa,

J. Orear, Fizyka, t. I i II, Wydawnictwo Naukowo Techniczne, Warszawa.

Cz. Bobrowski, Fizyka – krótki kurs, Wydawnictwo Naukowo Techniczne, Warszawa

Wykład 2

Ruch jednowymiarowy

Zajmiemy się opisem ruchu rozumianym jako zmiany położenia jednych ciał względem innych, które nazywamy układem odniesienia. Zwróć uwagę, że to samo ciało może poruszać się względem jednego układu odniesienia a spoczywać względem innego. Oznacza to, że ruch jest pojęciem względnym.

Prędkość

Prędkość jest zmianą odległości w jednostce czasu.

Prędkość stała

Jeżeli ciało, które w pewnej chwili t0 znajdowało się w położeniu x0, porusza się ze stałą prędkością v to po czasie t znajdzie się w położeniu x danym związkiem

x-x0 = v(t − t0)

czyli

(2.1)

Interpretacja graficzna: prędkość to nachylenie prostej x(t) (różne nachylenia wykresów x(t) odpowiadają różnym prędkościom).

Wielkość v (wektor) może być dodatnia albo ujemna, jej znak wskazuje kierunek ruchu !!! Wektor v ujemny to ruch w kierunku malejących x.

Prędkość chwilowa

Jeżeli obiekt przyspiesza lub zwalnia to wskazania szybkościomierza nie zgadzają się z wyrażeniem (2.1) chyba, że weźmiemy bardzo małe wartości x − x0x) czyli również bardzo małe t ‑ t0t). Stąd prędkość chwilowa:

Tak definiuje się pierwszą pochodną, więc

(2.2)

Prezentacja graficzna

Prędkość chwilowa przejście od siecznej do stycznej. Nachylenie stycznej to prędkość chwilowa (w chwili t odpowiadającej punktowi styczności).

Prędkość średnia

Średnia matematyczna. Znaczenie średniej - przykłady. Przykłady rozkładów niejednostajnych - czynniki wagowe.

Przykład 1

Samochód przejeżdża odcinek 20 km z prędkością 40 km/h a potem, przez następne 20 km, jedzie z prędkością 80 km/h. Oblicz prędkość średnią.

t1 = x1/v1 = 20/40 = 0.5 h

t2 = x2/v2 = 20/80 = 0.25 h

= 53.33 km/h

a nie 60 km/h; (wagi statystyczne). Ponieważ viti = xi więc

(2.3)

przesunięcie wypadkowe/czas całkowity.

Przykład 2

Korzystamy z wartości średniej do obliczenia drogi hamowania samochodu, który jedzie z prędkością 25 m/s (90 km/h). Czas hamowania 5 sekund. Prędkość maleje jednostajnie (stała siła hamowania). Prędkość średnia 12.5 m/s (45 km/h).

Z równania (2.3) x - x0 = 12.5·5 = 62.5 m.

To najkrótsza droga hamowania. Wartość średnia daje praktyczne wyniki. Ten przykład wprowadza nas do omówienia przyspieszenia.

Przyspieszenie

Przyspieszenie to tempo zmian prędkości.

Przyspieszenie jednostajne i chwilowe

Prędkość zmienia się jednostajnie z czasem czyli przyspieszenie

(2.4)

jest stałe.

Gdy przyspieszenie zmienia się z czasem musimy wtedy ograniczyć się do pomiaru zmian prędkości Δv w bardzo krótkim czasie Δt (analogicznie do prędkości chwilowej). Odpowiada to pierwszej pochodnej v względem t.

(2.5)

Ruch jednostajnie zmienny

Często chcemy znać zarówno położenie ciała jak i jego prędkość. Ze wzoru (2.4) mamy v = v0 + at. Natomiast do policzenia położenia skorzystamy ze wzoru (2.3).

Ponieważ w ruchu jednostajnie przyspieszonym prędkość rośnie jednostajnie od v0 do v więc prędkość średnia wynosi

= (v0 + v)/2

Łącząc otrzymujemy

x = x0 + (1/2) (v0 + v)t

gdzie za v możemy podstawić v0 + at. Wtedy

x = x0 + (1/2) [v0 + (v0 +at)] t

więc ostatecznie

(2.6)

Dyskutując ruch po linii prostej możemy operować liczbami, a nie wektorami bo mamy do czynienia z wektorami równoległymi. Jednak trzeba sobie przy opisie zjawisk (rozwiązywaniu zadań) uświadamiać, że mamy do czynienia z wektorami.

Przykład 3

Dwa identyczne ciała rzucono pionowo do góry z prędkością początkową v0 w odstępie czasu Δt jedno po drugim. na jakiej wysokości spotkają się te ciała?

Dane: v0, Δt, g - przyspieszenie ziemskie.

Możemy rozwiązać to zadanie obliczając odcinki dróg przebytych przez te ciała:

1) , v = v0 - gtg, v = 0

2)

3), tg + td = t + Δt

Trzeba teraz rozwiązać układ tych równań.

Można inaczej: h - to położenie czyli wektor (nie odcinek). Podobnie v0t i (1/2)gt2.

W dowolnej chwili h jest sumą dwóch pozostałych wektorów. Opis więc jest ten sam w czasie całego ruchu (zarówno w górę jak i w dół).

Sprawdźmy np. dla v0 = 50 m/s, g = 10 m/s2; więc równanie ma postać: h = 50t-5t2. Wykonujemy obliczenia przebytej drogi i wysokości w funkcji czasu i zapisujemy w tabeli poniżej

czas [s] położenie (wysokość) droga [m]
0 0 0
1 45 45
2 80 80
3 105 105
4 120 120
5 125 125
6 1 w dół 120
7 2 105
8 3 80
9 4 45
10 5 0

Opis matematyczny musi odzwierciedlać sytuację fizyczną. Na tej samej wysokości h ciało w trakcie ruchu przebywa 2 razy (w dwóch różnych chwilach; pierwszy raz przy wznoszeniu, drugi przy opadaniu). Równanie musi być więc kwadratowe (2 rozwiązania). Rozwiązaniem równania (1/2)gt2 - v0t + h = 0 są właśnie te dwa czasy t1 i t2.

Z warunku zadania wynika, że t1t2 = Δt. Rozwiązanie:

Pamiętanie o tym, że liczymy na wektorach jest bardzo istotne. Szczególnie to widać przy rozpatrywaniu ruchu na płaszczyźnie.

Wykład 3

Ruch na płaszczyźnie

Ruch w dwóch wymiarach będziemy opisywać w układzie współrzędnych x i y. Np. y - wysokość, x - odległość w kierunku poziomym. Pokażemy, że taki ruch można traktować jak dwa niezależne ruchy jednowymiarowe.

Przemieszczenie, prędkość i przyspieszenie.

Położenie punktu w chwili t przedstawia wektor r; prędkość wektor v; przyspieszenie wektor a. Wektory r, v, a są wzajemnie zależne od siebie i dadzą się przedstawić (za pomocą wersorów i, j, k czyli wektorów jednostkowych) w postaci

Czy trzeba stosować rozkładanie wektorów na składowe?

Przykład 1

Żaglówka płynąca pod wiatr (pod kątem 45° do kierunku wiatru). Siła, którą wiatr działa na żagiel, popycha łódkę prostopadle do płaszczyzny żagla. Ze względu na kil (i ster) łódź może poruszać się wzdłuż osi kila. Składowa siły w tym kierunku (Fx) ma zwrot w kierunku ruchu.

Ruch ze stałym przyspieszeniem oznacza, że nie zmienia się kierunek ani wartość przyspieszenia tzn. nie zmieniają się również składowe przyspieszenia.

Rozpatrzymy teraz przypadek punkt materialnego poruszającego się wzdłuż krzywej leżącej na płaszczyźnie.

Rozpoczniemy od napisania równań dla ruchu jednostajnie przyspieszonego

a = const

v = v0 + at

r = r0 + v0t + (1/2) at2

Prześledźmy teraz dodawanie wektorów na wykresie. Przykładowo punkt porusza się z przyspieszeniem a = [2,1], prędkość początkowa v0 = [1,2], a położenie początkowe, r0 = [1,1]. Szukamy położenia ciała np. po t = 1s i t = 3s dodając odpowiednie wektory tak jak na rysunku obok.

Powyższe równania wektorowe są równoważne równaniom w postaci skalarnej:

Równania opisujące ruch wzdłuż

osi x

Równania opisujące ruch wzdłuż

osi y

ax = const

vx = vx0t + axt

x = x0 + vx0t + (1/2) axt2

ay = const

vy = vy0t + ayt

y = y0 + vy0t + (1/2) ayt2

Przykładem na którym prześledzimy ruch krzywoliniowy ze stałym przyspieszeniem jest rzut ukośny.

Rzut ukośny

Rzut ukośny to ruch ze stałym przyspieszeniem g [0, -g] skierowanym w dół. Jest opisywany przez równania podane powyżej w tabeli. Przyjmijmy, że początek układu współrzędnych pokrywa się z punktem, z którego wylatuje ciało tzn. r0 = 0.

Prędkość w chwili początkowej t = 0 jest równa v0 i tworzy z kąt θ z dodatnim kierunkiem osi x. Zadaniem naszym jest: znaleźć prędkość i położenie ciała w dowolnej chwili, opisać tor, znaleźć zasięg. Składowe prędkości początkowej (zgodnie z rysunkiem) wynoszą odpowiednio

vx0 = v0 cosθ i vy0 = v0 sinθ

Prędkość w kierunku x (poziomym)

vx = vx0 + axt

ponieważ ax = 0 więc: vx = v0 cosθ, czyli w kierunku x ruch jest jednostajny (składowa x prędkości jest stała)

W kierunku y (pionowym)

vy = vy0 + ayt

ponieważ gy = -g więc

vy = v0 sinθ – gt

Wartość wektora wypadkowego prędkości w dowolnej chwili wynosi

więc

(3.1)

Teraz obliczamy położenie ciała

x = v0xt

czyli

x = v0 cosθ t (3.2)

y = v0yt+(1/2)ayt2

czyli

y = v0 sinθ t – (1/2)gt2 (3.3)

Długość wektora położenia r można teraz obliczyć dla dowolnej chwili t z zależności

Sprawdźmy po jakim torze porusza się nasz obiekt tzn. znajdźmy równanie krzywej y(x). Mamy równania x(t) i y(t). Równanie y(x) obliczymy eliminując t z równań (3.2) i (3.3). Z równania (3.2)

t = x/v0 cosθ

więc równanie (3.3) przyjmuje postać

(3.4)

Otrzymaliśmy równanie paraboli (ramionami w dół).

Z równania paraboli obliczamy zasięg Z czyli znajdziemy miejsca zerowe. Do równania (3.3) wstawiamy x = Z oraz y = 0 i otrzymujemy po przekształceniach dwa miejsca zerowe

Z = 0

oraz

(3.5)

Z równania (3.4) wynika, że zasięg jest maksymalny gdy θ = 45°.

Zauważmy, że omawiany ruch odbywa się po linii krzywej.

W poprzednich wykładach mówiliśmy o przyspieszeniu zmieniającym wartość prędkości, a nie jej kierunek (zwrot). Mówiliśmy o przyspieszeniu stycznym.

Rozpatrzmy teraz sytuacje gdy wartość prędkości się nie zmienia a zmienia się kierunek.

Ruch jednostajny po okręgu

Rozważmy zamieszczony obok rysunek. Punkt P ‑ położenie punktu materialnego w chwili t, a P' ‑ położenie w chwili t + Δt. Wektory v, v' mają jednakowe długości ale różnią się kierunkiem; są styczne do toru (krzywej) odpowiednio w punktach P i P'.

Przerysujmy wektory v i v' zaznaczając zmianę prędkości Δv. Zauważmy, że kąt pomiędzy tymi wektorami jest taki sam jak kąt na pierwszym rysunku. Zaznaczone trójkąty są podobne więc :, gdzie l jest długością łuku (pod warunkiem, że l jest bardzo małe (l→0)). Stąd

Δv = vl/r.

a ponieważ

l = v Δt

więc

Δv = v2 Δt/r

Ostatecznie

a = Δvt

więc

(3.6)

To przyspieszenie nazywamy przyspieszeniem normalnym (w odróżnieniu od stycznego) bo jest prostopadłe do toru. W przypadku ruchu po okręgu kierunek prostopadły do toru jest skierowany do środka i dlatego takie przyspieszenie nazywamy również przyspieszeniem dośrodkowym. Przyspieszenie normalne zmienia kierunek prędkości.

Często wyraża się to przyspieszenie przez okres T. Ponieważ

v = 2πr/T

więc

a = 4π2r/T2

Przykład 2

Jakiego przyspieszenia dośrodkowego, wynikającego z obrotu Ziemi, doznaje ciało będące na równiku? RZ = 6370 103 m, T = 8.64 104 sec.

a = 0.0034 m/s2.

Stanowi to 0.35 % przyspieszenia ziemskiego g = 9.81 m/s2.

Przy założeniu, że Ziemia jest kulą waga na równiku jest mniejsza (np. łatwiej pobić rekord w skoku wzwyż).

Prześledźmy teraz przykład, w którym zmienia się i wartość i kierunek prędkości. Wracamy do rzutu ukośnego. Przyspieszenie g (jedyne) jest odpowiedzialne za zmianę zarówno wartości prędkości jak i jej kierunku.

Prezentacja graficzna z zaznaczeniem przyspieszenia stycznego i normalnego (jako składowych g) jest przedstawiona poniżej.

Teraz obliczymy obie składowe przyspieszenia.

a) Przyspieszenie styczne

Przypomnijmy, że zależność v(t) w rzucie ukośnym jest dana równaniem (3.1) ().

Stąd

b) Przyspieszenie dośrodkowe

Jak wynika z rysunku

lub

ale trzeba umieć obliczyć promień krzywizny w każdym punkcie toru.

Wykład 4

Dynamika punktu materialnego

Wstęp

Dotychczas staraliśmy się opisywać ruch za pomocą wektorów r, v, oraz a. Były to rozważania geometryczne. Teraz omówimy przyczyny ruchu, zajmiemy się dynamiką.

Nasze rozważania ograniczymy do przypadku dużych ciał poruszających się z małymi (w porównaniu z prędkością światła w próżni) prędkościami tzn. zajmujemy się mechaniką klasyczną.

Podstawowy problem mechaniki klasycznej:

  1. mamy ciało (zachowujące się jak punkt materialny) o znanych właściwościach (masa, ładunek itd.),

  2. umieszczamy to ciało, nadając mu prędkość początkową, w otoczeniu, które znamy,

  3. pytanie: jaki będzie ruch ciała?

Aby badać ruch ciała wywołany siłą na nie działającą trzeba wiedzieć jakiego rodzaju jest to siła i skąd się bierze. Teraz zajmiemy się ogólnymi skutkami sił a dalej będziemy rozważać specjalne własności sił grawitacyjnych, elektromagnetycznych, słabych i jądrowych.

W dzisiejszym rozumieniu mechaniki klasycznej w celu rozwiązania naszego problemu musimy:

  1. wprowadzić pojęcie siły F,

  2. ustalić sposób przypisania masy m aby opisać fakt, że różne ciała wykonane z tego samego materiału, w tym samym otoczeniu uzyskują różne przyspieszenia (np. pchamy z całą siłą dwa rożne pojazdy i uzyskują różne a),

  3. szukamy sposobu obliczenia sił działających na ciało na podstawie właściwości tego ciała i otoczenia - szukamy praw rządzących oddziaływaniami ("teorii").

Definicje

Masa

Definicja o charakterze operacyjnym (recepta na postępowanie). Nieznaną masę m porównujemy ze wzorcem masy 1 kg. Umieszczamy pomiędzy nimi sprężynę i zwalniamy ją. Masy, które początkowo spoczywały polecą w przeciwnych kierunkach z prędkościami v0 i v.

Nieznaną masę m definiujemy jako

(4.1)

Pęd

Pęd ciała definiujemy jako iloczyn jego masy i jego prędkości wektorowej.

(4.2)

(Intuicyjnie, ta wielkość ma istotne znaczenie np. przy opisie zderzeń gdzie liczy się zarówno prędkość jak i masa.)

Siła

Jeżeli na ciało o masie m działa pojedyncza siła F1, to definiujemy ją jako zmianę w czasie pędu ciała.

(4.3a)

po rozwinięciu

Dla ciała o stałej masie

(4.3b)

Przykłady układów o stałej i zmiennej masie.

Zasady dynamiki Newtona

Aby przewidzieć ruch pod wpływem siły musimy mieć "teorię". Czy teoria jest dobra czy nie można stwierdzić tylko poprzez doświadczenie.

Podstawowa teoria, która pozwala nam przewidywać ruch ciał, składa się z trzech równań, które nazywają się zasadami dynamiki Newtona.

Najpierw podamy sformułowanie, a potem dyskusja i rozwinięcie.

Sformułowanie pierwszej zasady dynamiki Newtona

Ciało pozostaje w stanie spoczynku lub w stanie stałej prędkości (zerowe przyspieszenie) gdy jest pozostawione samo sobie (działająca na nie siła wypadkowa jest równa zero).

a = 0, gdy Fwypadkowa = 0

gdzie Fwypadkowa jest sumą wektorową wszystkich sił działających na ciało.

Uwaga: a = 0, oznacza, że nie zmienia się ani wartość ani kierunek tzn. ciało jest w spoczynku lub porusza się ze stałą co do wartości prędkością po linii prostej (stały kierunek).

Sformułowanie drugiej zasady dynamiki Newtona

Tempo zmiany pędu ciała jest równe sile wypadkowej działającej na to ciało.

(4.4)

Zwróćmy uwagę, że w definicji F mówimy o pojedynczej sile, a tu mamy do czynienia z siłą wypadkową.

Sformułowanie trzeciej zasady dynamiki Newtona

Gdy dwa ciała oddziałują wzajemnie, to siła wywierana przez ciało drugie na ciało pierwsze jest równa i przeciwnie skierowana do siły, jaką ciało pierwsze działa na drugie

FA→B = - FB→A

Pierwsza zasada dynamiki Newtona

Pierwsza zasada wydaje się być szczególnym przypadkiem drugiej. Przypisujemy jej jednak wielką wagę ze względów historycznych (przełamanie dogmatu Arystotelowskiego, że wszystkie ciała muszą się zatrzymać gdy nie ma sił zewnętrznych) oraz dlatego, że zawiera ważne prawidło fizyczne: istnienie inercjalnego układu odniesienia.

Pierwsza zasada dynamiki stwierdza, że jeżeli na ciało nie działają siły zewnętrzne to istnieje taki układ odniesienia, w którym to ciało spoczywa lub porusza się ruchem jednostajnym prostoliniowym. Taki układ nazywamy układem inercjalnym.

Każdy ruch musi być opisany względem pewnego układu odniesienia. Układy inercjalne są tak istotne bo we wszystkich takich układach ruchami ciał rządzą dokładnie te sama prawa. Większość omawianych zagadnień będziemy rozwiązywać właśnie w inercjalnych układach odniesienia. Zazwyczaj przyjmuje się, że są to układy, które spoczywają względem gwiazd stałych ale układ odniesienia związany z Ziemią w większości zagadnień jest dobrym przybliżeniem układu inercjalnego.

Ponieważ przyspieszenie ciała zależy od przyspieszenia układu odniesienia (obserwatora), w którym jest mierzone więc druga zasada dynamiki jest słuszna tylko, gdy obserwator znajduje się w układzie inercjalnym. Inaczej mówiąc, prawa strona równania F = ma zmieniałaby się w zależności od przyspieszenia obserwatora.

Zauważmy, że pierwsza zasada nie wprowadza żadnego rozróżnienia między ciałami spoczywającymi i poruszającymi się ze stałą prędkością. Każdy z tych stanów może być naturalnym stanem ciała gdy nie ma żadnych sił. Nie ma różnicy pomiędzy sytuacją gdy nie działa żadna siła i przypadkiem gdy wypadkowa wszystkich sił jest równa zeru.

Druga zasada dynamiki Newtona

Wiemy już, że ta zasada jest słuszna gdy obserwator znajduje się w układzie inercjalnym. Siła w drugiej zasadzie dynamiki jest siłą wypadkową (trzeba brać sumę wektorową wszystkich sił).

Zastanówmy się jaka jest różnica między definicją siły, a drugą zasadą dynamiki?

Czy F = ma nie powinno być prawdziwe z definicji, a nie dlatego, że jest to podstawowe prawo przyrody?

Różnica pomiędzy równaniami (4.3b) i (4.4) polega na tym, że w tym drugim występuje siła wypadkowa. To jest ważna różnica!!! Oznacza to, że w tym równaniu jest zawarta dodatkowa informacja (którą trzeba sprawdzić doświadczalnie), a mianowicie addytywność masy i wektorowe dodawanie sił. Chociaż wydaje się to banalne, że połączenie mas m1 i m2 daje przedmiot o masie m = m1 + m2 to jak każde twierdzenie w przyrodzie musi być sprawdzone doświadczalnie. Istnieją wielkości fizyczne, które nie są addytywne np. kąty (nieprzemienne dodawanie) czy objętości mieszanin (np. woda i alkohol).

Trzecia zasada dynamiki Newtona

Załóżmy, że mamy układ, który składa się z mA i mB. Wtedy jedynymi siłami będą siły oddziaływania między tymi ciałami np. grawitacyjne.

Trzecia zasada stwierdza, że w przypadku sił oddziaływania między dwoma ciałami FA = - FB .

Przykład 1

Rozważmy układ trzech ciał o masach 3m, 2m i m połączonych nitkami tak jak na rysunku. Układ jest ciągnięty zewnętrzną siłą F. Szukamy przyspieszenia układu i naprężeń nici. Siły przenoszone są przez sznurki (zakładamy, że ich masy są zaniedbywalne).

Piszemy II zasadę dynamiki dla każdego ciała osobno

F - N1 = 3ma

N1 -N2 = 2ma

N2 = ma

Dodając stronami otrzymujemy

F = (3m + 2m + m)a

stąd

a = F/6m, N1 = F/2, N2 = F/6

Jednostki siły i masy

W układzie SI: niuton (N) 1N = 1kg·1m/s2

Wykład 5

Dynamika punktu materialnego II

Siły kontaktowe i tarcie

Siły kontaktowe

Gdy dwa ciała są dociskane do siebie to występują między nimi siły kontaktowe. Źródłem tych sił jest odpychanie pomiędzy atomami. Przy dostatecznie małej odległości występuje przekrywanie chmur elektronowych i ich odpychanie rosnące wraz z malejącą odległością. To jest siła elektromagnetyczna i może być bardzo duża w porównanie z siłami grawitacyjnymi.

Jeżeli siła ciężkości pcha blok w dół siłą Fg to powstaje druga siła - siła kontaktowa F1. Siła wypadkowa Fwyp = 0. We wszystkich przypadkach stosowania drugiej zasady dynamiki Newtona jest bardzo istotne, żeby obliczyć siłę wypadkową.

Przykład 1

Rozważmy dwa klocki m1 i m2 na gładkiej powierzchni. Do klocka m1 przyłożono siłę F. Czy siła F jest przenoszona poprzez klocek 1 na klocek 2? Gdyby tak było to zgodnie z trzecią zasadą dynamiki Newtona klocek 2 działałby na klocek 1 siłą równą i przeciwnie skierowaną. Wtedy Fwyp równałaby się zero!!!!, czyli, że nie można by było poruszyć ciała 1 bez względu na to jak duża jest siła F.

Zasada Newtona nie mówi, że siła F jest przenoszona przez klocek 1 na klocek 2; powinno się przyjąć siłę kontaktową Fk o dowolnej wartości. Ogólnie: powinno się stosować drugą zasadę dynamiki oddzielnie do każdego ciała.

Dla klocka 1 otrzymujemy wtedy F - Fk = m1a

Dla klocka 2 Fk = m2a

Stąd przyspieszenie a = F/(m1 + m2)

Zauważmy, że ten wynik można otrzymać gdy traktujemy te dwa klocki jak jedną masę m = m1 + m2.

Tarcie

Siły kontaktowe, o których mówiliśmy są normalne (prostopadłe) do powierzchni. Istnieje jednak składowa siły kontaktowej leżąca w płaszczyźnie powierzchni. Jeżeli ciało pchniemy wzdłuż stołu to po pewnym czasie ciało to zatrzyma się. Z drugiej zasady dynamiki wiemy, że jeżeli ciało porusza się z przyspieszeniem to musi działać siła. Taką siłę nazywamy siłą tarcia.

Rozważmy np. klocek, do którego przykładamy "małą" siłę F tak, że klocek nie porusza się. Oznacza to, że sile F przeciwstawia się siła tarcia T. Mamy więc: T = -F. Zwiększamy stopniowo siłę F aż klocek zaczyna się poruszać. Im gładsza powierzchnia tym szybciej to nastąpi. Oznacza to, że siła tarcia zmienia się od wartości zero do pewnej wartości krytycznej w miarę wzrostu siły F. Oznaczmy tę krytyczną siłę Ts (s‑statyczna). To jest maksymalna siła tarcia statycznego.

Ts (dla pary powierzchni suchych) spełnia dwa prawa empiryczne:

  1. Jest w przybliżeniu niezależna od powierzchni zetknięcia (w szerokim zakresie),

  2. Jest proporcjonalna do siły normalnej (prostopadłej) z jaką jedna powierzchnia naciska na drugą.

Stosunek siły Ts do nacisku FN nazywamy współczynnikiem tarcia statycznego µs

(5.1)

Uwaga: Mówimy tylko o wartościach tych sił bo są one do siebie prostopadłe. Jeżeli F jest większe od Ts to klocek poruszy się, ale będzie istniała siła tarcia Tk (k - kinetyczna) przeciwstawiająca się ruchowi.

Siła Tk spełnia trzy prawa empiryczne:

  1. Jest w przybliżeniu niezależna od powierzchni zetknięcia (w szerokim zakresie),

  2. Jest proporcjonalna do siły normalnej (prostopadłej) z jaką jedna powierzchnia naciska na drugą,

  3. Nie zależy od prędkości względnej poruszania się powierzchni.

Istnieje odpowiedni współczynnik tarcia kinetycznego µk

(5.2)

Dla większości materiałów µk jest nieco mniejszy od µs. Np. µk ≈ 1 dla opon na jezdni betonowej.

Tarcie jest bardzo złożonym zjawiskiem i wyjaśnienie go wymaga znajomości oddziaływań atomów na powierzchni. Nie będziemy się tym zajmować. Ograniczmy się do zauważenia, że tarcie odgrywa bardzo istotną rolę w życiu codziennym. W samochodzie np. na pokonanie siły tarcia zużywa się około 20% mocy silnika. Tarcie powoduje zużywanie poruszających się części maszyn. Staramy się je zwalczać. Z drugiej strony bez tarcia nie moglibyśmy chodzić, jeździć samochodami, trzymać ołówka, kredy, czy też nimi pisać.

Siły bezwładności

We wstępie wyszczególnione zostały cztery rodzaje sił występujących w przyrodzie. Wszystkie te siły nazywamy siłami rzeczywistymi, ponieważ możemy je zawsze związać z jakimś konkretnym ciałem, możemy podać ich pochodzenie. Czy to samo możemy powiedzieć np. o takich siłach jakich działania "doznajemy" np. przy przyspieszaniu, hamowaniu czy zakręcaniu samochodu?

Przykład 2

Dwaj obserwatorzy opisują ruch kulki w sytuacji pokazanej na rysunku poniżej.

Jeden z obserwatorów znajduje się w wózku a drugi stoi na Ziemi. Wózek początkowo porusza się ze stałą prędkością po linii prostej (rys. 1), następnie hamuje ze stałym opóźnieniem a (rys. 2). Między kulką a wózkiem nie ma tarcia.

Gdy wózek jedzie ze stałą prędkością to obydwaj obserwatorzy stwierdzają zgodnie na podstawie pierwszej zasady dynamiki, że na kulkę nie działa żadna siła. Zwróćmy uwagę, że obserwatorzy znajdują się w inercjalnych układach odniesienia. Sytuacja zmienia się gdy wózek zaczyna hamować (rys. 2). Obserwator związany z Ziemią dalej twierdzi, że kulka porusza się ze stałą prędkością, a tylko podłoga wózka przesuwa się pod nim. Natomiast obserwator w wózku stwierdza, że kulka zaczyna się poruszać się z przyspieszeniem –a w stronę przedniej ściany wózka. Dochodzi do wniosku, że na kulkę o masie mk zaczęła działać siła

F1 = ‑ mka

ale nie może wskazać żadnego ciała, będącego źródłem tej siły. Mówiliśmy już, że druga zasada dynamiki jest słuszna tylko w inercjalnym układzie odniesienia. Zauważmy, że obserwator w wózku znajduje się teraz w układzie nieinercjalnym. Widać, że jest w błędzie; nie istnieje rzeczywista siła F1. Jest to tak zwana pozorna siła bezwładności.

Powstaje więc pytanie jak postępować gdy musimy rozwiązać problem w układzie nieinercjalnym. W tym celu rozpatrzmy dalszy ruch kulki. Gdy dotrze ona do przedniej ścianki to wówczas według obserwatora na Ziemi (układ inercjalny) będzie poruszać się z przyspieszeniem a (takim jak wózek) bo działa na nią siła Fs sprężystości przedniej ściany wózka równa

Fs = mka

Natomiast obserwator w wózku stwierdza, że kulka przestała się poruszać; spoczywa względem niego. Jego zdaniem siła sprężystości ściany Fs równoważy siłę F1, tak że siła wypadkowa jest równa zeru i kulka nie porusza się

Fs + F1 = 0

co po podstawieniu za F1 = ‑ mka daje

Fs = mka

Okazuje się, że wynik otrzymany przez obserwatora w układzie nieinercjalnym jest taki sam jak dla obserwatora związanego z Ziemią ale pod warunkiem uwzględnienia sił pozornych. Siły te "znikają" jeśli rozpatrujemy ruch z punktu widzenia układu inercjalnego. Wprowadzenie ich pozwala po prostu na stosowanie mechaniki klasycznej do opisu zdarzeń w układach poruszających się z przyspieszeniem. W takim układzie uwzględniamy, że na każde ciało działa siła wprost proporcjonalna do masy tego ciała, do przyspieszenia układu a i jest skierowana przeciwnie do a.

Przykład 3

Winda porusza się ruchem jednostajnie zmiennym. Czas spadania ciała puszczonego swobodnie w tej windzie, na drodze od sufitu do podłogi, jest o 25% większy niż w windzie stojącej. Obliczyć przyspieszenie windy. Dane jest przyspieszenie ziemskie g.

Rozwiązujemy zadanie w układzie inercjalnym i nieinercjalnym tzn. obserwator w jednym przypadku znajduje się na zewnątrz windy, a w drugim jest pasażerem tej windy.

W przypadku pierwszym obserwator "widzi" (mierzy), że ciało przebywa dłuższą drogę gdy winda jest w ruchu.

Dla windy stojącej

Dla windy w ruchu

oraz

przy czym

Rozwiązanie tego układu równań daje wynik

Drugi obserwator za każdym razem widzi, że ciało przebywa tę samą drogę H od sufitu do podłogi ale w różnych czasach. Wniosek: w obu przypadkach jest różne przyspieszenie. Obserwator wprowadza do obliczeń dodatkową siłę nadającą przyspieszenie –a. Odpowiednie równania wyglądają teraz:

Dla windy stojącej

Dla windy w ruchu

Uwzględniając, że

otrzymujemy .

Tak więc uwzględnienie sił bezwładności jest konieczne jeżeli chcemy stosować zasady dynamiki w układach nieinercjalnych.

W takim układzie uwzględniamy, że na każde ciało działa siła wprost proporcjonalna do masy tego ciała, do przyspieszenia układu a i jest skierowana przeciwnie do a.

Inny przykład stanowią układy nieinercjalne poruszające się ruchem obrotowym. Np. obserwator w satelicie krążącym wokół Ziemi obserwując ciało spoczywające w tym satelicie stwierdza, że siła wypadkowa działająca na ten obiekt jest równa zeru. Musi więc istnieć, według niego, siła która równoważy siłę grawitacji (dośrodkową). Siłę tę nazywamy siłą odśrodkową i jest to siła pozorna.

Na zakończenie rozpatrzmy ruch postępowy ciała w obracającym się układzie odniesienia. Przykładem może być człowiek poruszający się po linii prostej (radialnie) od środka do brzegu karuzeli obracającej się z prędkością kątową ω. Na rysunku poniżej pokazana jest zmiana prędkości człowieka.

Linia (promień) wzdłuż której porusza się człowiek zmienia swój kierunek (karuzela obraca się) o kąt Δθ w czasie Δt, człowiek zmienia swoje położenie z punktu A do A'. Obliczymy teraz zmianę jego prędkości radialnej vr i stycznej vs. Prędkość radialna zmienia swój kierunek.

Prędkość styczna natomiast zmienia zarówno kierunek (przyspieszenie dośrodkowe) ale również wartość bo człowiek oddala się od środka (rośnie r).

Najpierw rozpatrzmy różnicę prędkości vr w punktach A i A' pokazaną na powyższym rysunku po prawej stronie. Dla małego kąta Δθ (tzn. małego Δt) możemy napisać

Δvr = vr Δθ

Jeżeli obustronnie podzielimy równanie przez Δt to w granicy Δt 0 otrzymamy

Zmienia się również prędkość styczna bo człowiek porusza się wzdłuż promienia. W punkcie A prędkość styczna vs = ωr, a w punkcie A' vs' = ω(rr). Zmiana prędkości stycznej wynosi więc

Δvs = ω(rr) - ωr = ωΔr

Jeżeli obustronnie podzielimy równanie przez Δt to w granicy Δt 0 otrzymamy

Przyspieszenia a1 i a2 mają ten sam kierunek (równoległy do vs) więc przyspieszenie całkowite wynosi

a = a1 + a2 = 2ωvr (5.3)

Przyspieszenie to jest nazywane przyspieszeniem Coriolisa. Pochodzi ono stąd, że nawet przy stałej prędkości kątowej ω rośnie prędkość liniowa człowieka bo rośnie r. Gdyby człowiek stał na karuzeli to obserwator stojący na ziemi mierzyłby tylko przyspieszenie dośrodkowe (ω2r) skierowane do środka wzdłuż promienia. Natomiast gdy człowiek idzie na zewnątrz to obserwator rejestruje także przyspieszenie Coriolisa (o kierunku równoległym do vs). Oczywiście musi istnieć siła działająca w tym kierunku. Jest nią w tym przypadku siła tarcia między podłogą i butami idącego człowieka.

Jednak obserwator związany z karuzelą nie widzi ani przyspieszenia dośrodkowego ani przyspieszenia Coriolisa, człowiek poruszający się wzdłuż promienia jest w stanie równowagi w układzie karuzeli. A przecież istnieje realnie odczuwalna (rzeczywista) siła tarcia. Żeby wyeliminować tę rozbieżność obserwator stojący na karuzeli wprowadza dwie siły pozorne równoważące siłę tarcia. Jedna to siła odśrodkowa, a druga to siła Coriolisa. Siła odśrodkowa działa radialnie na zewnątrz, a siła Coriolisa stycznie ale przeciwnie do vs.

Ogólnie, na ciało o masie m poruszające się ruchem postępowym z prędkością v w obracającym się układzie odniesienia działa siła bezwładności zwana siłą Coriolisa Fc

Fc = 2mv×ω (5.4)

Wprowadzenie sił pozornych (nie umiemy pokazać ich źródła) jest konieczne aby móc stosować mechanikę klasyczną w układach nieinercjalnych.

Ziemia nie jest idealnym układem inercjalnym ponieważ wiruje. W wyniku tego obrotu w zjawiskach zachodzących na Ziemi obserwujemy siłę Coriolisa. Przykładowo, rzeki płynące na półkuli północnej podmywają silniej prawy brzeg. Również ciała spadające swobodnie odchylają się od pionu pod działaniem tej siły. W większości rozpatrywanych przez nas zjawisk można jednak zaniedbać wpływ ruchu Ziemi na ich przebieg.

Wykład 6

Ciążenie powszechne (grawitacja)

Prawo powszechnego ciążenia

Newton - 1665 spadanie ciał. Skoro istnieje siła przyciągania pomiędzy dowolnym ciałem i Ziemią, to musi istnieć siła między każdymi dwoma masami m1 i m2. Skoro siła jest proporcjonalna do masy ciała to musi być proporcjonalna do każdej z mas m1 i m2 oddzielnie czyli:

Fm1m2

Newton zastanawiał się również, czy siła działająca na ciała będzie malała wraz ze wzrostem odległości. Doszedł do wniosku, że gdyby ciało znalazło się w odległości takiej jak Księżyc to będzie ono miało takie samo przyspieszenie jak Księżyc bowiem natura siły grawitacyjnej pomiędzy Ziemią i Księżycem jest taka sama jak pomiędzy Ziemią i każdym ciałem.

Przykład 1

Obliczmy jakie jest przyspieszenie Księżyca i jaki jest stosunek przyspieszenia Księżyca do przyspieszenia grawitacyjnego przy powierzchni Ziemi?

Zastosujemy równanie na przyspieszenie dośrodkowe (wykład 3 - ruch jednostajny po okręgu). Wówczas:

gdzie RK jest odległością od Ziemi do Księżyca. Ta odległość wynosi 3.86·105 km, a okres obiegu Księżyca T = 27.3 dnia. Otrzymujemy więc

a = 2.73·10-3 m/s2

W pobliżu powierzchni Ziemi przyspieszenie wynosi 9.8 m/s2. Stąd stosunek przyspieszeń wynosi:

a/g = 1/3590 ≅ (1/60)2

W granicach błędu a/g = .

Newton wykonał takie obliczenia i wyciągnął wniosek, że siła przyciągania między dwoma masami maleje odwrotnie proporcjonalnie do kwadratu odległości między nimi (odległość między środkami mas). Sformułował więc prawo powszechnego ciążenia

Stałą proporcjonalności oznacza się G, więc

(6.1)

Newton oszacował wartość stałej G zakładając średnią gęstość Ziemi ρ = 5·103 kg/m3 (porównać to z gęstością pierwiastków z układu okresowego np. ρSi = 2.8·103 kg/m3, ρFe = 7.9·103 kg/m3).

Punktem wyjścia jest równanie:

Jeżeli weźmiemy r = RZ to otrzymamy:

Zgodnie z II zasadą Newtona F = ma, gdzie a = g.

Stąd

więc

Wiemy, że MZ = ρVZ więc

Uwzględniając RZ = 6.37·106 m otrzymamy G = 7.35·10-11 Nm2/kg2 co jest wartością tylko o 10% większą niż ogólnie przyjęta wartość 6.67·10-11 Nm2/kg2.

Porównując przyspieszenie grawitacyjne na orbicie Księżyca i na powierzchni Ziemi, Newton zakładał, że Ziemia zachowuje się tak jakby jej cała masa była skupiona w środku. Zgadywał, że tak ma być ale dowód matematyczny przeprowadził dopiero 20 lat później (wtedy też sformułował rachunek całkowy).

Równanie (6.1) nazywa się prawem powszechnego ciążenia, ponieważ dokładnie to samo prawo stosuje się do wszystkich sił grawitacyjnych. To samo prawo wyjaśnia spadanie ciał na Ziemię, tłumaczy ruch planet, pozwala obliczyć ich masy i okresy obiegu.

Przykład 2

Jaki był okres obiegu Księżyca przez moduł statku Apollo?

F = ma

gdzie MK jest masą Księżyca, a R promieniem orbity po jakiej krąży moduł o masie m. Ponieważ przyspieszenie

więc

Podstawiając wartości liczbowe: promień Księżyca R = 1740 km, masę MK = 7.35·1022 kg i G = 6.67·10-11 Nm2/kg2, otrzymamy T = 6.5·103 s czyli 108 minut.

Doświadczenie Cavendisha

Newton obliczył wartość stałej G na podstawie przyjętego założenia o średniej wartości gęstości Ziemi. Gdyby Ziemia miała tak jak gwiazdy jądro o super wielkiej gęstości to wynik uzyskany przez Newtona byłby obarczony dużym błędem. Czy można wyznaczyć stałą G w laboratorium niezależnie od masy Ziemi i tym samym uniknąć błędu związanego z szacowaniem gęstości Ziemi?

W tym celu trzeba zmierzyć siłę oddziaływania dwóch mas m1 i m2 umieszczonych w odległości x (rysunek).

Wówczas siła

F = Gm1m2/x2

czyli

Zauważmy, że dla mas każda po 1 kg oddalonych od siebie o 10 cm siła F ma wartość = 6.67·10-9 N tj. 109 razy mniej niż ciężar 1 kg i jest za mała by ją wykryć (dokładnie) zwykłymi metodami.

Problem ten rozwiązał Henry Cavendish w 1797 r. Wykorzystał on fakt, że siła potrzebna do skręcenia długiego, cienkiego włókna kwarcowego o kilka stopni jest bardzo mała. Cavendish najpierw wykalibrował włókna, a następnie zawiesił na nich pręt z dwiema małymi kulkami ołowianymi na końcach (rysunek a). Następnie w pobliżu każdej z kulek umieścił większą kulę ołowianą i zmierzył precyzyjnie kąt o jaki obrócił się pręt (rysunek b). Pomiar wykonane metodą Cavendisha dają wartość G = 6.67·10-11 Nm2/kg2.

Ważenie Ziemi

Mając już godną zaufania wartość G, Cavendish wyznaczył MZ z równania:

Wynik pomiaru jest równie dokładny jak wyznaczenia stałej G. Cavendish wyznaczył też masę Słońca, Jowisza i innych planet, których satelity zostały zaobserwowane. Np. na rysunku poniżej niech M będzie masą Słońca, a m masą planety krążącej wokół Słońca np. Ziemi.

Wtedy

F = GMm/R2

Ponieważ przyspieszenie

a = 4π2R/T

to z równania F = ma otrzymujemy

czyli

Jeżeli R jest odległością Ziemia - Słońce, T = 1 rok, to M jest masą Słońca. Podobne obliczenia można przeprowadzić dla innych planet.

Prawa Keplera ruchu planet

Zanim Newton zapostulował prawo powszechnego ciążenia, Johannes Kepler stwierdził, że ruch planet stosuje się do trzech prostych praw. Prawa Keplera wzmocniły hipotezę Kopernika. Praca Keplera (1609 - 1619) była wielkim odkryciem i aktem odwagi zwłaszcza po tym jak w 1600 roku spalono na stosie Giordana Bruno zwolennika systemu heliocentrycznego. Przypomnijmy, że nawet Galileusz został zmuszony do publicznego odwołania swoich poglądów (1633 r) mimo, że papież był jego przyjacielem.

Dogmatem wtedy był pogląd, że planety poruszają się wokół Ziemi po skomplikowanych torach, które są złożeniem pewnej liczby okręgów. Np. do opisania orbity Marsa trzeba było około 12 okręgów różnej wielkości.

Kepler poszukiwał nieskomplikowanej geometrycznie orbity, żeby udowodnić że Mars i Ziemia muszą obracać się wokół Słońca. Po latach pracy odkrył trzy proste prawa, które zgadzały się z wynikami pomiarowymi pozycji planet z bardzo dużą dokładnością. Te prawa stosują się też do satelitów okrążających jakąś planetę.

Każda planeta krąży po orbicie eliptycznej, ze Słońcem w jednym z ognisk tej elipsy.

Linia łącząca Słońce i planetę zakreśla równe pola w równych odstępach czasu.

Sześciany półosi wielkich orbit dowolnych dwóch planet mają się do siebie jak kwadraty ich okresów obiegu. (Półoś wielka jest połową najdłuższej cięciwy elipsy).

Dla orbit kołowych

Newton rozwijając swoją teorię potrafił dowieść, że tylko wtedy, gdy siła jest odwrotnie proporcjonalna do kwadratu odległości, orbita dowolnej planety jest elipsą ze Słońcem w jednym z ognisk oraz, że . Newton wyprowadził prawa Keplera z zasad dynamiki. Przykładowo wyprowadźmy III prawo Keplera dla planet poruszających się po orbitach kołowych.

Korzystając z otrzymanego uprzednio wzoru na masę Słońca otrzymamy dla pierwszej planety:

a dla drugiej

Porównując otrzymamy

Drugie prawo Keplera wynika z zasady zachowania pędu (dowód można pominąć).

Ciężar

Ciężar zazwyczaj definiujemy jako siłę ciążenia działającą na ciało. W pobliżu powierzchni Ziemi dla ciała o masie m będzie ona równa mg. Na Księżycu ciężar jest mniejszy w porównaniu z ciężarem na Ziemi około sześć razy.

Definicja ciężaru może być myląca. Np. astronauta pomimo, że działa na niego jeszcze siła ciążenia uważa, że jest w stanie nieważkości. Fizjologiczne odczucie ciężaru czyli ile siły trzeba włożyć np. do podniesienia ręki.

Ciężar pozorny, masa bezwładna i masa grawitacyjna

Ważną konsekwencją tego, że siła grawitacyjna działająca na ciało jest proporcjonalna do jego masy, jest możliwość pomiaru masy za pomocą mierzenia siły grawitacyjnej. Można to zrobić używając wagi sprężynowej albo porównując siły grawitacyjne działające na masę znaną (wzorzec) i na masę nieznaną innymi słowy ważąc ciało na wadze. Powstaje pytanie czy w obu metodach mierzymy tę samą właściwość. Np. gdy spróbujemy pchnąć klocek po idealnie gładkiej poziomej powierzchni to wymaga to pewnego wysiłku, a przecież ciążenie nie pojawia się tu w ogóle. Konieczność przyłożenia siły jest związana z masą. Ta masa występuje we wzorze F = ma. Nazywamy ją masą bezwładną m. W innej sytuacji utrzymujemy ten klocek uniesiony w górę w stanie spoczynku. Bezwładność nie odgrywa tu żadnej roli bo ciało nie przyspiesza, jest w spoczynku. Ale musimy używać siły o wartości równej przyciąganiu grawitacyjnemu między ciałem i Ziemią, żeby ciało nie spadło. Odgrywa tu rolę ta właściwość ciała, która powoduje jego przyciąganie przez inne obiekty takie jak Ziemia i siła jest tu dana wzorem

gdzie m' jest masą grawitacyjną. Czy m i m' ciała są sobie równe?

Masa bezwładna m1 spadając swobodnie w pobliżu powierzchni Ziemi ma przyspieszenie a1, przy czym

jeżeli inna masa m2 uzyskuje inne przyspieszenie a2 to

Dzieląc te równania przez siebie otrzymamy

Widzimy, że jeżeli wszystkie ciała spadają z tym samym przyspieszeniem a1 = a2 = g to stosunek mas bezwładnych jest równy stosunkowi mas grawitacyjnych. Jeżeli dla jednej substancji ustalimy, że masa bezwładna jest równa masie grawitacyjnej to prawdziwe to będzie dla wszystkich substancji. Aktualnie jesteśmy w stanie stwierdzić, że a1 = a2 z dokładnością 10-10. Te wyniki sugerują, że masa bezwładna jest równa masie grawitacyjnej. To stwierdzenie nazywa się zasadą równoważności.

Konsekwencją jest to, że nie można rozróżnić między przyspieszeniem układu (laboratorium), a przyspieszeniem grawitacyjnym. Ta zasada jest punktem wyjścia ogólnej teorii względności Einsteina.

Pole grawitacyjne

Na przykładzie sił grawitacyjnych omówimy ważne w fizyce pojęcie pola. Nasze rozważania rozpoczynamy od umieszczenia masy M w początku układu. W punkcie przestrzeni opisanym wektorem r znajduje się natomiast masa m. Wektor r opisuje położenie masy m względem masy M więc siłę oddziaływania grawitacyjnego między tymi masami (równanie 6.1) możemy zapisać w postaci wektorowej

(6.2)

Zwróćmy uwagę, że siłę tę możemy potraktować jako iloczyn masy m i wektora γ(r) przy czym

(6.3)

Jeżeli w punkcie r umieścilibyśmy inną masę np. m' to ponownie moglibyśmy zapisać siłę jako iloczyn masy m' i tego samego wektora γ(r)

Widzimy, że wektor γ(r) nie zależy od obiektu na który działa siła (masy m) ale zależy od źródła siły (masa M) i charakteryzuje przestrzeń otaczającą źródło (wektor r). Oznacza to, że masa M stwarza w punkcie r takie warunki, że umieszczona w nim masa m odczuje działanie siły. Inaczej mówiąc masie M przypisujemy obszar wpływu (działania), czyli pole.

Zwróćmy uwagę, że rozdzieliliśmy siłę na dwie części. Stwierdzamy, że jedna masa wytwarza pole, a następnie to pole działa na drugą masę. Taki opis pozwala uniezależnić się od obiektu (masy m) wprowadzanego do pola.

Z pojęcia pola korzysta się nie tylko w związku z grawitacją. Jest ono bardzo użyteczne również przy opisie zjawisk elektrycznych i magnetycznych. Źródłami i obiektami działania pola elektrycznego są ładunki w spoczynku, a pola magnetycznego ładunki w ruchu. Właściwości pól wytwarzanych przez ładunki elektryczne omówimy w dalszych rozdziałach.

Chociaż pole jest pojęciem abstrakcyjnym jest bardzo użyteczne i znacznie upraszcza opis wielu zjawisk. Na przykład gdy mamy do czynienia z wieloma masami, możemy najpierw obliczyć w punkcie r pole pochodzące od tych mas, a dopiero potem siłę działającą na masę umieszczoną w tym punkcie.

Z polem sił wiąże się nie tylko przestrzenny rozkład wektora natężenia pola, ale również przestrzenny rozkład energii. Właśnie zagadnieniom dotyczącym pracy i energii są poświecone następne rozdziały.

Pole grawitacyjne wewnątrz kuli

Rozpatrzmy teraz pole czaszy kulistej o masie m i promieniu R. Dla r > R pole jest równe Gm/r2 tj. tak jakby cała masa była skupiona w środku kuli (przykład z satelitą). Jakie jest jednak pole wewnątrz czaszy?

Rozważmy przyczynki od dwóch leżących naprzeciwko siebie powierzchni A1 i A2 w punkcie P wewnątrz czaszy (rysunek poniżej). Fragment A1 czaszy jest źródłem siły F1 ~ A1/(r1)2 ciągnącej w lewo. Powierzchnia A2 jest źródłem siły ciągnącej w prawo F2 ~ A2/(r2)2 .

Mamy więc

Z rozważań geometrycznych widać, że

(pola powierzchni stożków ~ do kwadratu wymiarów liniowych)

Po podstawieniu do pierwszego równania otrzymujemy

Tak więc wkłady wnoszone przez A1 i A2 znoszą się. Można w ten sposób podzielić całą czaszę i uzyskać siłę wypadkową równą zero. Tak więc wewnątrz czaszy pole grawitacyjne jest równe zeru. Pole wewnątrz czaszy mającej skorupę dowolnej grubości też jest zero bo możemy podzielić tę skorupę na szereg cienkich warstw koncentrycznych.

Na rysunku poniżej przedstawiono pełną kulę o promieniu R i masie M.

W punkcie P pole pochodzące od zewnętrznej warstwy jest zerem. Pole pochodzi więc tylko od kuli o promieniu r czyli

a = Gm/r2 lub a = GρV/r2

Dla kuli V = 4πr3/3. Gęstość więc pole w punkcie P wynosi

Widzimy, że pole zmienia się liniowo z r.

Wykład 7

Praca i energia

Wstęp

Podstawowym zagadnieniem dynamiki jest określenie ruchu punktu, jeżeli znana jest siła działająca na ten punkt. W pierwszym kroku wyznaczamy przyspieszenie

a = F/m

Gdy m i F stałe to a też jest stałe i wtedy możemy prosto obliczyć prędkość

v = v0 + at

i położenie

x = v0t + at2/2

Zagadnienie jest bardziej złożone gdy F nie jest stała. Trzeba posługiwać się bardziej skomplikowaną matematyką (całkowanie). Mamy często do czynienia z takimi siłami np. siła grawitacji między dwoma ciałami zależy od ich odległości, siła wywierana przez rozciągniętą sprężynę zależy od stopnia rozciągnięcia.

Postępowanie pozwalające określić ruch punktu prowadzi nas do pojęcia pracy, energii i twierdzenia o pracy i energii. Zagadnienia związane z energią są tak istotne (szeroko rozumiana ekonomia, ekologia, zasoby energii itd.), że ich znajomość jest konieczna dla wszelkich rozważań zarówno ekonomicznych, technologicznych jak i społecznych. Problemy energii (jej różne formy ich konwersja itd.) będą odtąd przewijać się stale przez wykłady. Z energią związana jest najważniejsza chyba zasada całej fizyki ‑ zasada zachowania energii. Nakłada ona sztywne granice na przetwarzanie energii i jej wykorzystanie. Będzie ona centralnym tematem większości działów fizyki omawianych na wykładach. W mechanice zasada zachowania energii pozwala obliczać w bardzo prosty sposób ruch ciał bez konieczności korzystania z zasad dynamiki Newtona.

Praca wykonana przez stałą siłę

W najprostszym przypadku, siła F jest stała, a punkt porusza się w kierunku działania siły. Wtedy

W = F·s = Fs cosα (7.1)

(Iloczyn dwóch wektorów daje liczbę).

Zastanówmy się czy kąt α może być różny od zera? Odpowiedź jest twierdząca, bo stała siła nie musi mieć kierunku zgodnego z kierunkiem ruchu punktu materialnego. Oczywiście muszą działać jeszcze inne siły (np. ciężar, tarcie). Gdyby działała tylko jedna to i tak ciało nie musiałoby poruszać się w kierunku jej działania np. rzut ukośny (tylko grawitacja).

Wzór Fs cosα określa jedynie pracę wykonaną przy przemieszczaniu punktu przez jedną siłę. Pracę wykonaną przez inne należy obliczyć oddzielnie i potem je zsumować. Zwróćmy uwagę, że gdy α = 0 otrzymujemy pierwszy wzór Fs. Gdy α = 90° to z równania wynika, że W = 0.

Przykłady

(a) i (b) W = 0 bo α = 90°, (c) i (d) bo przesunięcie s = 0.

Jednostką pracy jest w układzie SI dżul (J), 1J = 1N·1m.

Często używa się jednostki elektronowolt 1eV = 1.6·10-19 J.

Przykład 2

Sanki o masie 5 kg są ciągnięte ze stałą prędkością po poziomej powierzchni (rysunek). Jaka praca zostanie wykonana na drodze s = 9 m, jeśli współczynnik tarcia kinetycznego wynosi 0.2, a sznurek, za który ciągniemy tworzy kąt 45° z poziomem?

Pracę obliczamy z zależności:

W = Fs cosα

Aby obliczyć pracę musimy znaleźć F. Z warunku stałej prędkości (w kierunku poziomym)

Fcosα ‑ T = 0

a dla kierunku pionowego

Fsinα +Rmg = 0

Nacisk na podłoże (równy reakcji podłoża) wynosi mgFsinα, więc siła tarcia wynosi

T = µ (mg - Fsinα)

Te równania pozwalają wyliczyć F (eliminując T).

F = µmg/(cosα+µsinα)

więc praca

W = Fs cosα = µmgs cosα/(cosα+µsinα)

Praca wykonana przez siłę zmienną

Rozważmy teraz siłę będącą funkcją położenia F(x), której kierunek jest zgodny z osią x. Szukamy pracy jaką wykona ta siła przy przesuwaniu ciała od położenia x1 do położenia x2. Jak skorzystać ze wzoru W = Fs cosα czyli co podstawić za F, skoro wartość jej zmienia się (rysunki poniżej)?

Zaczynamy od przybliżenia. Dzielimy całkowite przemieszczenie na n jednakowych odcinków Δx (rysunek poniżej). Wewnątrz takiego przedziału przyjmujemy (to jest to przybliżenie), że siła jest stała (prawie) i możemy teraz policzyć pracę na tym odcinku Δx: ΔWi = FiΔx, gdzie Fi jest wartością siły na tym odcinku. Zwróćmy uwagę, że od strony czysto formalnej (geometria) liczenie pracy jest równoważne liczeniu sumy powierzchni prostokątów o szerokości Δx i wysokości Fi. Następnie możemy zsumować prace na kolejnych odcinkach (zsumować pola prostokątów) i otrzymać pracę całkowitą.

Żeby poprawić to przybliżenie dzielimy przedział (x1, x2) na więcej (mniejszych) odcinków Δx (patrz kolejny rysunek).

I teraz znowu powtarzamy procedurę sumowania. Przybliżenie jest lepsze bo siła ma prawie stałą wartość wewnątrz "małych" przedziałów Δx (pola powierzchni prostokątów bardziej pokrywają się z polem pod krzywą).

Widać, że rozwiązaniem problemu jest przejście (w granicy) Δx → 0.

Stosujemy tę samą procedurę obliczając

(7.2)

To jest definicja całki. Liczbowo odpowiada to liczeniu pola powierzchni pod krzywą (w zadanym przedziale - granicach). Odpowiada to też z definicji liczeniu wartości średniej co zgadza się z intuicyjnym podejściem: W = Fśrednia(x2x1)

Trzeba więc albo umieć rozwiązać całkę (albo poszukać w tablicach) lub umieć obliczyć pole powierzchni pod krzywą co może być czasem łatwe.

Np. rozważmy sprężynę zamocowaną jednym końcem do ściany i rozciąganą siłą F tak, że jej koniec przemieszcza się o x.

Siła wywierana przez sprężynę jest siłą przywracającą równowagę i wynosi F = ‑x.

Aby rozciągnąć sprężynę musimy przyłożyć siłę równą co do wartości lecz przeciwnie skierowaną. Tak więc F = k x.

Teraz obliczmy pracę

Możemy też wprost obliczyć pole pod wykresem F(x).

Pole powierzchni jest polem trójkąta i wynosi

P = (1/2) x·kx = (1/2) kx2

i zgadza się z wynikiem uzyskanym z obliczenia całki.

To był przypadek jednowymiarowy. Przypadek 2 i 3-wymiarowy są w zasadzie swej rozpatrywane podobnie ale matematycznie trudniejsze.

Energia kinetyczna i twierdzenie o pracy i energii

W przykładzie z sankami mieliśmy do czynienia z ruchem bez przyspieszenia. Oznaczało to, że wypadkowa siła działająca na ciało wynosi zero. Teraz rozważmy przypadek gdy ciało porusza się pod wpływem niezrównoważonej siły. Najprostszy przypadek to stała siła czyli ruch ze stałym przyspieszeniem. Jaką pracę wykonuje ta siła przy przemieszczeniu ciała na odległość x?

Zakładamy, że kierunek siły F i przyspieszenia a pokrywa się z kierunkiem osi x. Dla stałego przyspieszenia mamy

oraz

co w połączeniu daje

Wykonana praca jest równa

(7.3)

Połowę iloczynu masy ciała i kwadratu prędkości nazywamy energią kinetyczną.

Praca wykonana przez wypadkową siłę F działającą na punkt materialny jest równa zmianie energii kinetycznej tego punktu.

W = EkEk0 (7.4)

To jest twierdzenie o pracy i energii.

Gdy nie ma zmiany wartości prędkości to nie ma zmiany energii kinetycznej tzn. nie jest wykonywana praca (np. siła dośrodkowa). Z twierdzenia powyższego wynika, że jednostki pracy i energii są takie same.

Moc

Rozważmy czas w jakim wykonywana jest praca. Często interesuje nas szybkość wykonania pracy a nie jej wartość. To jest właśnie moc.

Moc średnia: Pśrednia = W/t

Moc chwilowa: P = dW/dt

Oczywiście gdy moc jest stała w czasie to Pśrednia = P.

Jednostką mocy jest wat. 1W = 1J/1s.

Dla celów praktycznych używa się kW (kilowatów) lub KM (koni mechanicznych przy czym 1 KM ≈ (3/4) kW.

Wykład 8

Zasada zachowania energii

Wstęp

Korzystając z drugiej zasady dynamiki Newtona pokazaliśmy, że

W = ΔEk

Często na punkt materialny działa kilka sił, których suma wektorowa jest siłą wypadkową: F = F1 + F2 + F3 +.......+ Fn. Wtedy praca jest sumą algebraiczną prac wykonanych przez poszczególne siły: W = W1 + W2 + W3 +...........+ Wn.

Twierdzenie o pracy i energii ma wtedy postać

W1 + W2 + W3 +...........+ WnEk

Będziemy właśnie rozpatrywać układy, w których działają różne siły, pozwoli to na definiowanie różnych rodzajów energii.

Siły zachowawcze i niezachowawcze

Zaczynamy od rozważmy przykładów dwóch rodzajów sił: sił zachowawczych i sił niezachowawczych.

Najpierw rozpatrzmy sprężynę jak w przykładzie z poprzedniego wykładu.

Przesuwamy ciało o masie m z prędkością v w kierunku sprężyny, tak jak na rysunku.

Założenia:

  1. ruch na płaszczyźnie odbywa się bez tarcia,

  2. sprężyna jest idealna tzn. spełnia ona prawo Hooke'a: F = -kx, gdzie F jest siłą wywieraną przez sprężynę kiedy jej swobodny koniec jest przemieszczony na odległość x,

  3. masa sprężyny jest zaniedbywalnie mała w porównaniu z masą ciała, więc cała energia kinetyczna w układzie sprężyna + ciało jest zgromadzona w tym ciele.

Przy ściskaniu sprężyny, prędkość ciała, a wobec tego i energia kinetyczna maleje aż do zatrzymania ciała. Następnie ciało porusza się w przeciwnym kierunku pod wpływem sprężyny. Prędkość i energia kinetyczna rosną aż do wartości jaką ciało miało początkowo. Interpretowaliśmy energię kinetyczną jako zdolność ciała do wykonania pracy kosztem jego ruchu (kosztem Ek). Po przebyciu zamkniętej drogi (cyklu) zdolność ciała do wykonania pracy pozostaje taka sama, jest zachowana. Siła sprężysta wywierana przez idealną sprężynę jest zachowawcza. Inne siły, działają także w ten sposób, np. siła grawitacji. Ciało rzucone do góry, przy zaniedbaniu oporu powietrza, wróci z tą samą prędkością i energią kinetyczną.

Jeżeli jednak ciało, na które działa jedna lub więcej sił powraca do położenia początkowego i ma inną energię kinetyczną niż na początku to oznacza, że po przebyciu drogi zamkniętej zdolność tego ciała do wykonania pracy nie została zachowana. Oznacza to, że przynajmniej jedną z działających sił określa się jako niezachowawczą.

Aby zilustrować ten przypadek, załóżmy, że powierzchnia nie jest idealnie gładka, że mamy do czynienia z tarciem. Ta siła tarcia przeciwstawia się ruchowi bez względu w którym kierunku porusza się ciało (nie tak jak siła sprężystości czy grawitacji) i ciało wraca z mniejszą energią kinetyczną. Mówimy, że siła tarcia (i inne działające podobnie) są niezachowawcze.

Możemy przeanalizować zachowawczy charakter sił analizując pracę jaką wykonuje ta siła nad punktem materialnym.

W pierwszym przykładzie (bez tarcia) praca wykonana przez siłę sprężystą, gdy sprężyna ulega ściskaniu, jest ujemna (siła jest skierowana przeciwnie do przemieszczenia, cos180° = -1). Gdy sprężyna rozprężą się praca jest dodatnia (siła i przemieszczenie jednakowo skierowane). Podczas pełnego cyklu praca wykonana przez siłę sprężystą (siłę wypadkową) jest równa zero.

W drugim przykładzie (uwzględniamy tarcie). Praca wykonywana przez siłę tarcia jest ujemna dla każdej części cyklu (tarcie zawsze przeciwstawia się ruchowi).

Ogólnie: Siła jest zachowawcza, jeżeli praca wykonana przez tę siłę nad punktem materialnym, który porusza się po dowolnej drodze zamkniętej jest równa zeru. Siła jest niezachowawcza jeżeli praca wykonana przez tę siłę nad punktem materialnym, który porusza się po dowolnej drodze zamkniętej nie jest równa zeru.

Możemy jeszcze trzecim sposobem rozważyć różnicę między siłami niezachowawczymi i zachowawczymi. Rozpatrzmy ruch z punktu A do B po jednej drodze (1) a powrót z B do A po innej (2) (patrz rysunek).

Jeżeli siła jest zachowawcza to

WAB,1 + WBA,2 = 0

bo droga zamknięta. Możemy to zapisać inaczej

WAB,1 = ‑ WBA,2

Ale gdyby odwrócić kierunek ruchu i przejść z A do B po drugiej drodze to, ponieważ zmieniamy tylko kierunek to

WAB,2 = -WBA,2

Skąd otrzymujemy

WAB,1 = WAB,2

Widać z tego, że praca wykonana przez siłę zachowawczą przy przemieszczaniu od A do B jest taka sama dla obu dróg. Drogi 1 i 2 mogą mieć dowolny kształt byleby tylko łączyły te same punkt A i B.

Siłę nazywamy zachowawczą jeżeli praca wykonana przez nią nad punktem materialnym poruszającym się między dwoma punktami zależy tylko od tych punktów, a nie od łączącej je drogi. Siłę nazywamy niezachowawczą jeżeli praca wykonana przez nią nad punktem materialnym poruszającym się między dwoma punktami zależy od drogi łączącej te punkty.

Przedstawione definicje są równoważne.

Energia potencjalna

Skupimy się teraz na odosobnionym układzie ciało + sprężyna. Zamiast mówić ciało się porusza będziemy mówić: stan układu się zmienia.

Widzieliśmy, że gdy nie występuje tarcie to energia kinetyczna maleje a potem rośnie tak, że wraca do początkowej wartości w cyklu zamkniętym. W tej sytuacji (gdy działają siły zachowawcze) staje się celowe wprowadzenie pojęcia energii stanu lub energii potencjalnej Ep. Mówimy, że jeżeli energia kinetyczna układu zmieni się o wartość ΔEk to tym samym zmienił się stan układu to energia potencjalna Ep (stanu) tego układu musi się zmienić o wartość równą co do wartości bezwzględnej, lecz przeciwną co do znaku, tak że suma tych zmian jest równa zeru

ΔEk + ΔEp = 0

Innymi słowy, każda zmiana energii kinetycznej Ek jest równoważona przez równą co do wartości, a przeciwną co do znaku zmianę energii potencjalnej Ep układu, tak że ich suma pozostaje przez cały czas stała

Ek + Ep. = const. (8.1)

Energia potencjalna przedstawia formę nagromadzonej energii, która może być całkowicie odzyskana i zamieniona na energię kinetyczną. Nie można więc wiązać energii potencjalnej z siłą niezachowawczą.

W przykładzie ze sprężyną (bez tarcia) energia kinetyczna ciała początkowo maleje, a zlokalizowana w sprężynie energia potencjalna rośnie. Z twierdzenia o pracy i energii

W = ΔEk

więc dla zachowawczej siły F

W = ΔEk = - ΔEp

Stąd

(8.2)

Możemy więc zapisać zależność między siłą i energią potencjalną

(8.3)

Trzeba zwrócić uwagę, że naprawdę potrafimy tylko policzyć ΔEp a nie Ep samą. Ponieważ ΔEp = EpBEpA. Żeby znaleźć EpB trzeba nie tylko znać siłę ale jeszcze wartość EpA

Punkt A nazywamy punktem odniesienia i zazwyczaj wybieramy go tak (umowa), żeby Ep było równe zeru w tym punkcie (porównanie z potencjałem elektrycznym).

Przykłady energii potencjalnej dla jednowymiarowych sił zachowawczych

  1. grawitacyjna energia potencjalna (w pobliżu powierzchni Ziemi)

Ruch wzdłuż osi y

F(y) = -mg

F jest stała. Przyjmujemy, że dla y = 0, Ep(0) = 0.

Wtedy

Sprawdzenie

  1. energia potencjalna sprężyny

Ruch wzdłuż osi x

F(x) = -kx

Przyjmujemy dla x = 0, Ep(0) = 0.

Wtedy

Sprawdzenie:

Energia potencjalna i potencjał pola grawitacyjnego

W przykładzie powyżej obliczyliśmy energię potencjalną związaną z siłą grawitacyjną w pobliżu powierzchni Ziemi, gdzie przyjmowaliśmy, że siła grawitacji jest stała. Teraz zajmiemy się zagadnieniem bardziej ogólnym i znajdziemy energię potencjalną masy m znajdującej się w  dowolnym punkcie nad powierzchnią Ziemi odległym o r od środka Ziemi.

Dla sił zachowawczych zmianę energii potencjalnej ciała przy przejściu ze stanu A do stanu B możemy zapisać jako

skąd

Żeby policzyć energię potencjalną w punkcie B musimy znać energię potencjalną w punkcie odniesienia A i policzyć pracę WAB.

Dla masy m znajdującej się w pewnym punkcie nad powierzchnią Ziemi odległym o r od środka Ziemi stan odniesienia wybiera się tak, że Ziemia i masa m znajdują się od siebie w nieskończonej odległości. Temu położeniu (r ∞) przypisujemy zerową energię potencjalną, EpA = 0. Zwróćmy uwagę, że stan zerowej energii jest również stanem zerowej siły. Siła grawitacji jest siłą zachowawczą więc dla wybranego punktu odniesienia

Musimy teraz obliczyć pracę . Ponieważ znamy siłę

to możemy obliczyć pracę i w konsekwencji energię potencjalną (znak minus wskazuje kierunek działania siły do środka Ziemi; siła przyciągająca)

(8.4)

Energia potencjalna ma wartość równo zeru w nieskończoności (punkt odniesienia) i maleje w miarę zmniejszania się r. Oznacza to, że siła jest przyciągająca. Wzór ten jest prawdziwy bez względu na wybór drogi po jakiej punkt porusza się z nieskończoności do r.

Widzimy, że z polem siły grawitacji wiąże się przestrzenny rozkład energii E(r) dany równaniem (8.4).

Omawiając na Wykładzie 6 pole grawitacyjne przedstawialiśmy siłę działającą na umieszczony w tym polu obiekt jako iloczyn natężenia pola i masy tego obiektu. Stwierdziliśmy, że jedna masa wytwarza pole, a następnie to pole działa na drugą masę. Inaczej mówiąc rozdzieliliśmy siłę na dwie części i w ten sposób uniezależniliśmy nasz opis od masy obiektu wprowadzanego do pola.

Podobnie możemy postąpić z energią potencjalną. Zauważmy, że zgodnie z wyrażeniem (8.4) możemy ją przedstawić jako iloczyn masy m i pewnej funkcji V(r)

(8.5)

Funkcję V(r) nazywamy potencjałem pola grawitacyjnego i definiujemy jako stosunek grawitacyjnej energii potencjalnej masy m do wartości tej masy

(8.6)

Jak już wspominaliśmy z pojęcia pola korzysta się nie tylko w związku z grawitacją. Przy opisie zjawisk elektrycznych również będziemy się posługiwali pojęciem pola (elektrycznego), jego natężenia i potencjału.

Przykład 1

Skorzystajmy teraz z wyrażenia na grawitacyjną energię potencjalną, żeby znaleźć prędkość jaką należy nadać obiektowi przy powierzchni Ziemi, aby wzniósł się on na wysokość h nad powierzchnię Ziemi Stosując zasadę zachowania energii otrzymujemy

czyli

a po przekształceniach

Jeżeli na powierzchni Ziemi dostarczymy ciału dostatecznie dużej energii kinetycznej wtedy ucieknie ono z Ziemi i nie powróci. Jego energia kinetyczna będzie malała w trakcie oddalania się, a potencjalna rosła.

Przykład 2

Teraz spróbujemy obliczyć jaką prędkość należy nadać obiektowi na Ziemi aby uciekł on z Ziemi na zawsze.

Praca potrzebna na przeniesieni ciała o masie m z powierzchni Ziemi do nieskończoności wynosi

Ep(RZ) = -GMZm/RZ

Jeżeli na powierzchni Ziemi dostarczymy ciału energii kinetycznej większej wtedy ucieknie ono z Ziemi i nie powróci. Energia kinetyczna będzie malała w trakcie oddalania się ciała, a potencjalna rosła. Krytyczna prędkość początkowa v0 (prędkość ucieczki) dana jest wzorem

Oczywiście pominęliśmy inne siły jak siły grawitacyjne wywierane przez Księżyc czy Słońce itp. Ta prędkość ucieczki nosi nazwę drugiej prędkości kosmicznej. Natomiast pierwszą prędkością kosmiczną nazywamy najmniejszą możliwą prędkość jaką musi mieć punkt materialny swobodnie krążący po orbicie wokół Ziemi.

Na poruszający się po orbicie obiekt działają dwie siły; siła grawitacji i siła odśrodkowa. Siły te mają przeciwne zwroty i dla stabilnej orbity równoważą się

i stąd znajdujemy

Pierwszej prędkości kosmicznej odpowiada orbita o promieniu r równym w przybliżeniu promieniowi Ziemi R. Dla r = R otrzymujemy wartość v = 7.9 km/s.

Zasada zachowania energii

Gdy działają siły zachowawcze to

W = ΔEk = EkBEkA

oraz

W = -ΔEp = - (EpB – EpA)

więc

- (EpB – EpA) = EkB – EkA

czyli

EkA + EpA = EkB + EpB (8.7)

Równania (8.1, 8.4) nazywa się zasadą zachowania energii mechanicznej.

Mówi ona, że dla ciała podlegającego działaniu siły zachowawczej, którego energia potencjalna jest równa Ep, suma energii kinetycznej i potencjalnej jest stała (o ile nie działają inne siły).

Przykład 3

Asekuracja wspinacza w górach. Wspinacz dobiera sobie linę, której wytrzymałość na zerwanie jest 25 razy większa niż jego własny ciężar (Fliny = 25mg). Lina (nylonowa) podlega prawu Hooke'a aż do zerwania, które następuje gdy lina wydłuży się o 25% w stosunku do długości początkowej. Czy wyposażony w taką linę wspinacz przeżyje spadek (niezależnie od wysokości)?

Ponieważ

Fliny = k(0.25l)

więc

25mg = k(0.25l)

skąd

k = 25mg/0.25l

czyli

k = 100mg/l

Przed spadkiem (punkt W)

Epw = mg(h + l)

Po spadku (punkt S)

Eps = mg(h - l - y) + ky2/2

Ponieważ w punktach W i S energia kinetyczna wspinacza jest równa zeru, więc

Epw = Eps

czyli

mg(h + l) = mg(h - l - y) +ky2/2

Uwzględniając k = 100 mg/l otrzymujemy

mgl = -mgl - mgy + (1/2)(100mg/l)y2

co daje

50y2 – ly ‑ 2l2 = 0

Rozwiązanie fizyczne: y = 0.21l mieści się w granicy wytrzymałości 0.25l.

Oszacujmy teraz maksymalne przyspieszenie

Fwyp = ky - mg

więc

ma = ky - mg

skąd

a = ky/m - g = 20g

Duże ale lina musi być sprężysta żeby "złagodzić" hamowanie.

A co z zachowaniem energii w przypadku gdy działa siła niezachowawcza?

Dla sił zachowawczych

lub

Wielkość po lewej stronie to po prostu zmiana całkowitej energii mechanicznej ΔE. Zatem równanie to ma postać ΔE = 0.

Jeżeli oprócz kilku sił zachowawczych działa siła niezachowawcza (np. tarcie) to wtedy

czyli

co jest równoważne

Widać, że siła tarcia zmienia energię mechaniczną układu (zmniejsza ją bo tarcie jest siłą rozpraszającą czyli dysypatywną).

Co stało się ze "straconą" energią mechaniczną?

Zostaje ona przekształcona na energię wewnętrzną U, która objawia się wzrostem temperatury. U jest równa rozproszonej energii mechanicznej. Więcej o energii wewnętrznej powiemy w dalszych rozdziałach. Uogólnijmy naszą dyskusję

Fwyp = Fzew + FZ + FNZ

Z twierdzenia o pracy i energii wynika, że praca wykonana przez siłę wypadkową jest równa zmianie energii kinetycznej.

co jest równoważne

Wzew - ΔEp - ΔU = ΔEk

czyli

Wzew = ΔEk + ΔEp + ΔU (8.8)

Z równania (8.5) wynika, że każda praca wykonana na ciele przez czynnik zewnętrzny równa się wzrostowi energii kinetycznej plus wzrost energii potencjalnej plus wzrost energii wewnętrznej. Cała energia została zarejestrowana. Mamy obejmujące wszystko zachowanie energii (całkowitej).

Wynika z niego, że energia może być przekształcona z jednej formy w inną, ale nie może być wytwarzana ani niszczona; energia całkowita jest wielkością stałą.

Przykład 4

Energia i biologia.

Przykładowo, na wykładzie z fizyki osoby śpiące zużywają energię w tempie około 80 J/s, a osoby uważające ok. 150W. Łagodne ćwiczenia 500 W intensywne 1000 W ale tylko 100 W na zewnątrz ciała jako energia mechaniczna (Człowiek może wykonywać pracę mechaniczną tylko z mocą 100 W).

Jak długo trzeba ćwiczyć (np. gimnastyka łagodna 500W) aby stracić (spalić) 500 g tłuszczu?

Tłuszcz zawiera ok. 40000 J/g. Stąd 500 g tłuszczu zawiera 2·107 J. Ponieważ P = E/t więc t = E/P = 2·107 J/ 500W = 11 h

Ile kalorii musi zawierać pożywienie aby utrzymać się przy życiu?

Minimalna moc 80 W (sen), 150 W gdy się nie śpi, średnio 110 W.

E = Pt = 110W·24·3600s = 9.5·106 J

Ponieważ 1 kilokaloria = 4180 J więc E = 2260 kcal (często mylona z cal).

Przykład 5

Energia i samochód.

Samochód jedzie z prędkością 100 km/h i zużywa 8 litrów benzyny na 100 km. Jaka moc jest potrzebna do utrzymania tej stałej prędkości?

1 litr benzyny - 3.7·107 J więc P = (8·3.7·107 J)/(3600s) = 7·104 W = 70 kW.

Dla porównania w mieszkaniu zużywamy około 1 - 1.5 kW energii elektrycznej.

Samochód zużywa kilkadziesiąt razy więcej.

Wykład 9

Zasada zachowania pędu

Środek masy

Dotychczas przedmioty traktowaliśmy jak punkty materialne, tzn. cząsteczki bezwymiarowe (objętość = 0) obdarzone masą co wystarczało w przypadku ruchu postępowego bo ruch jednego punktu odzwierciedlał ruch całego ciała.

W ogólnym przypadku ruch układu cząsteczek może być bardzo skomplikowany np.

  1. ciało może wirować lub drgać.

  2. w trakcie ruchu cząsteczki mogą zmieniać swoje wzajemne położenie.

Przykład ciała wirującego jest pokazany na rysunku poniżej.

Zauważmy, że istnieje w tym układzie jeden punkt, który porusza się po linii prostej ze stałą prędkością. Żaden inny punkt nie porusza się w ten sposób. Ten punkt to środek masy. Zajmiemy się ruchem tego punktu.

Zacznijmy od przypomnienia pojęcia średniej ważonej. W tym celu rozważmy prosty układ, w którym mamy do czynienia z dwoma skrzynkami zawierającymi np. jabłka o różnej masie. W jednej mamy n1 jabłek, każde o masie m1, w drugiej n2, każde o masie m2. Spróbujmy policzyć jaka jest średnia masa jabłka.

czyli

To jest średnia ważona (wagami są ułamki ilości jabłek w skrzynce). Uwzględniamy w ten sposób fakt, że liczby jabłek nie są równe.

Natomiast środek masy jest po prostu średnim położeniem przy czym masa jest czynnikiem ważącym przy tworzeniu średniej.

Np. dla dwóch różnych mas m1 i m2

czyli

Dla n mas leżących wzdłuż linii prostej otrzymamy

ponieważ suma jest całkowitą masą układu to możemy zapisać

Gdyby punkty nie leżały na jednej prostej to wówczas środek masy znajdziemy postępując dla każdej ze współrzędnych analogicznie jak powyżej.

Otrzymamy więc

oraz

Zwróćmy uwagę, że układ dwóch równań skalarnych można zastąpić przez jedno zwięzłe równanie wektorowe

(9.1)

Uogólnienie na trzy wymiary jest automatyczne.

Zauważmy, że środek masy układu punktów materialnych zależy tylko od mas tych punktów i od wzajemnego ich rozmieszczenia (nie zależy od wyboru układu odniesienia).

Przykład 1

Znaleźć środek masy układu trzech cząstek o masach m1 = 1kg, m2 = 2kg i m3 = 3kg, umieszczonych w rogach równobocznego trójkąta o boku 1m.

Ponieważ wynik nie zależy od wyboru układu odniesienia to możemy przyjąć układ tak jak na rysunku.

xśrm = (m1x1 + m2x2 + m3x3)/M = (1kg·0m + 2kg·1m + 3kg·0.5m)/6kg = 7/12m

yśrm = (m1y1 + m2y2 + m3y3)/M = (1kg·0m + 2kg·0m+3kg·m)/6kg = m

Uwaga: położenie środka masy nie pokrywa się z geometrycznym środkiem.

Przedyskutujmy teraz fizyczne znaczenie środka masy.

Ruch środka masy

Rozważmy układ punktów materialnych o masach m1, m2, m3 ..., mn i o stałej całkowitej masie M. Na podstawie równania (9.1) możemy napisać

Mrśrm = m1r1 + m2r2 +.......+ mnrn

gdzie rśrm jest środkiem masy w określonym układzie odniesienia. Różniczkując (względem czasu) powyższe równanie otrzymamy

lub

Mvśrm = m1v1 + m2v2 +.....+ mnvn

Jeżeli ponownie zróżniczkujemy otrzymane powyżej równanie to otrzymamy

lub

Maśrm = m1a1 + m2a2 + .......+ mnan

czyli

Maśrm = F1 + F2 + ...........+ Fn

Wobec tego możemy napisać

Maśrm = Fzew (9.2)

Z równania (9.2) wynika, że środek masy układu punktów materialnych porusza się w taki sposób, jakby cała masa układu była skupiona w środku masy i jakby wszystkie siły zewnętrzne nań działały.

To twierdzenie obowiązuje dla każdego układu punktów materialnych.

  1. Układ może być ciałem sztywnym (punkty mają stałe położenia względem siebie). Wtedy przy obliczeniach środka masy sumowanie zastępujemy całkowaniem.

  2. Układ może być zbiorem cząsteczek, w którym występują wszystkie rodzaje ruchu wewnętrznego.

Uwaga:

Gdy siłą zewnętrzną jest siła ciężkości to wtedy działa ona na środek ciężkości. W rozważanych przypadkach te dwa środki się pokrywają.

Pojęcie środka masy jest bardzo użyteczne np. do obliczania energii kinetycznej. Obliczmy Ek mierzone w układzie środka masy.

gdzie vwzgl jest prędkością mierzoną w układzie środka masy. Wykonując mnożenie skalarne otrzymamy

Ponieważ (jak pokazaliśmy wcześniej) wyraz drugi równa się iloczynowi M razy prędkość środka masy (Mvśrm = m1v1 + m2v2 +.....+ mnvn). W układzie środka masy, w którym mierzymy, vśrm = 0 więc drugi wyraz znika.

Zatem

gdzie Ek' jest energią kinetyczną mierzoną w układzie środka masy. Dla ciał sztywnych to równanie przyjmuje postać

gdyż w układzie środka masy ciało sztywne może mieć tylko energię rotacyjną (obrotową).

Przykład 2

Obręcz o masie m toczy się po płaszczyźnie tak, że środek obręczy ma prędkość v.

Jaka jest energia kinetyczna obręczy ?

gdzie vrot,wzg to prędkość obręczy w układzie środka masy. Ponieważ obserwator w układzie środka masy widzi obręcz obracającą się z prędkością v więc vrot,wzg = v.

Stąd

Zauważmy, że obręcz ma energię dwa razy większą od ciała o masie m poruszającego się z tą samą prędkością v (ale nie obracającego się).

Pęd układu punktów materialnych

Zdefiniowaliśmy już pęd punktu materialnego jako iloczyn jego masy m i prędkości v. Pokazaliśmy również, że II zasada dynamiki Newtona ma postać

Przypuśćmy jednak, że zamiast pojedynczego punktu mamy do czynienia z układem n punktów materialnych o masach m1, ......, mn. Zakładamy, że masa układu (M) pozostaje stała. Każdy punkt będzie miał pewną prędkość i pewien pęd. Układ jako całość będzie miał całkowity pęd P w określonym układzie odniesienia będący sumą geometryczną pędów poszczególnych punktów w tym układzie odniesienia

P = p1 + p2 + ......... + pn

Jeżeli porównamy tę zależność z równaniem

Mvśrm = m1v1 + m2v2 +.....+ mnvn

to otrzymujemy

P = Mvśrm

Treść tego równania można wyrazić następująco: Całkowity pęd układu punktów materialnych jest równy iloczynowi całkowitej masy układu i prędkości jego środka masy. Ponieważ Fzew = Maśrm, to II zasada dynamiki Newtona dla układu punktów materialnych przyjmuje postać

(9.3)

bo

Zasada zachowania pędu

Przypuśćmy, że suma sił zewnętrznych działających na układ jest równa zeru. Wtedy na podstawie równania (9.3)

Zasada zachowania pędu: Jeżeli wypadkowa sił zewnętrznych działających na układ jest równa zeru, całkowity wektor pędu układu pozostaje stały.

Zobaczymy jak ta zasada stosuje się do różnych sytuacji fizycznych. Omówimy teraz pojęcie sił zewnętrznych dla danego układu ‑ jak wybrać układ i jak stosować zasadę zachowania pędu.

Przykład 3

Rozważmy dwa ciała o masach mA i mB połączone nieważką sprężyną umieszczone na doskonale gładkim stole. Odciągamy od siebie te ciała na pewną odległość, a następnie puszczamy swobodnie (rysunek).

Spróbujmy opisać ruch tych ciał.

Najpierw ustalamy z czego składa się rozważany układ. Przyjmujemy, że tworzą go obie masy + sprężyna. Jeżeli tak to nie działa żadna siła zewnętrzna (działają siły pomiędzy elementami układu czyli siły wewnętrzne). Możemy teraz zastosować zasadę zachowania pędu. Przed zwolnieniem ciał pęd układu (w odniesieniu do stołu) był równy zeru. I taki pozostaje po ich zwolnieniu. Chociaż ciała poruszają się ich pęd może być równy zeru, ponieważ pęd będący wielkością wektorową jest sumą dodatniego pędu ciała A (porusza się w kierunku +x) i ujemnego pędu ciała B (porusza się w kierunku -x). Z zasady zachowania pędu

pęd początkowy = pęd końcowy

0 = mAvA + mBvB

Zatem

mBvB = ‑ mAvA

lub

vA = – mBvB/mA

Np. gdy mA = 2kg i mB = 1kg to vA jest równa połowie vB i ma zwrot przeciwny.

Przykład 4

Ta sama zasada obowiązuje w fizyce jądrowej i atomowej. Jako przykład rozpatrzmy rozpad promieniotwórczy. Cząstka α (jądro atomu helu) emitowana jest z prędkością 1.4·107 m/s i z energią kinetyczną 4.1 MeV przez jądro uranu 238, pozostające początkowo w spoczynku. Znaleźć prędkość odrzutu powstałego jądra toru 234.

Jako układ rozpatrujemy jądro toru 234 + cząstkę α (przed rozpadem po prostu jądro uranu 238). Ze względu na nieobecność sił zewnętrznych pęd układu, który przed rozpadem był równy zeru po rozpadzie pozostaje niezmieniony.

pęd początkowy = pęd końcowy

0 = Mαvα + MThvTh

więc

vTh = - Mαvα/MTh = ‑ 4·1.4·107/234 = -2.4·105 m/s

Wykład 10

Zasada zachowania pędu II

Układy o zmiennej masie

Dotychczas zajmowaliśmy się układami o stałej masie. Obecnie zajmiemy się układami, których masa zmienia się podczas obserwacji.

Przykładem niech będzie rakieta. Wyrzuca ona ze swej dyszy gorący gaz z dużą prędkością, zmniejszając w ten sposób swoją masę i zwiększając prędkość (rysunek poniżej).

Spaliny opuszczają silnik rakiety ze stałą prędkością vs względem Ziemi. Prędkość chwilowa rakiety względem Ziemi jest równa v, zatem prędkość spalin względem rakiety vwzg. jest dana zależnością

vwzgl = vs – v (10.1)

Jeżeli w pewnym przedziale czasowym dt z rakiety wyrzucona zostaje masa dms z prędkością v0 to masa rakiety maleje o dm a jej prędkość rośnie o dv, przy czym

(10.2)

Obliczmy teraz całkowitą szybkość zmian pędu P układu

(10.3)

Równanie to uwzględnia fakt, że w przypadku rakiety zmienia się zarówno jej masa jak i prędkość podczas gdy spaliny są wyrzucane ze stałą prędkością. Zmiana pędu układu jest zgodnie z II zasadą dynamiki Newtona równa sile zewnętrznej działającej na układ. Uwzględniając zależności (10.1) i (10.2) możemy przekształcić równanie (10.3) do postaci

(10.4)

Ostatni wyraz w równaniu (10.4) może być interpretowany jako siła wywierana na układ przez substancję (spaliny), która z niego wylatuje. W przypadku rakiety nosi ona nazwę siły ciągu.

Jeżeli ruch rakiety odbywa się w przestrzeni kosmicznej to siły zewnętrzne Fzew są do zaniedbania i wtedy zmiana pędu rakiety jest równa sile ciągu. Jeżeli jednak ruch odbywa się w pobliżu Ziemi (np. tuż po starcie) to wówczas Fzew reprezentuje ciężar rakiety i siłę oporu atmosfery i trzeba ją uwzględnić. Konstruktorzy rakiet starają się uzyskać jak największą siłę ciągu aby przezwyciężyć Fzew. Np. rakieta Saturn 5 o masie ponad 3 mln kg wytwarzała przy starcie ciąg 40 MN.

Obliczmy siłę ciągu dla rakiety o masie 15000 kg, która po spaleniu paliwa waży 5000 kg. Szybkość spalania paliwa wynosi 150 kg/s, a prędkość wyrzucania gazów względem rakiety jest równa 1500 m/s.

więc

F = 1500 m/s·150 kg/s = 2.25·105 N

Zwróćmy uwagę, że początkowo (rakieta z paliwem) siła działająca na rakietę skierowana ku górze jest równa sile ciągu 2.25·105 N minus ciężar rakiety (1.5·105 N). Po zużyciu paliwa wynosi 2.25·105 N - 0.5·105 N = 1.75·105 N.

Zderzenia

Wstęp

Co rozumiemy poprzez zderzenie?

Siły działające przez krótki czas w porównaniu do czasu obserwacji układu nazywamy siłami impulsowymi. Takie siły działają w czasie zderzeń np. uderzenie piłki o ścianę czy zderzenie kul bilardowych. Ciała w trakcie zderzenia nie muszą się "dotykać", a i tak mówimy o zderzeniu np. zderzenie cząstki alfa (4He) z jądrem jakiegoś pierwiastka (np. Au). Wówczas mamy do czynienia z odpychaniem elektrostatycznym. Pod zderzenia możemy podciągnąć również reakcje. Proton w trakcie zderzenia z jądrem może wniknąć do niego. Wreszcie możemy rozszerzyć definicję zderzeń o rozpady cząstek np. cząstka sigma rozpada się na pion i neutron: Σ = π- + n.

Wszystkie te "zdarzenia" posiadają cechy charakterystyczne dla zderzeń:

  1. można wyraźnie rozróżnić czas "przed zderzeniem" i "po zderzeniu"

  2. prawa zachowania pędu i energii pozwalają zdobyć wiele informacji o procesach na podstawie tego co "przed zderzeniem" i tego co "po zderzeniu" mimo, że niewiele wiemy o siłach "podczas" zderzenia.

Zderzenia w przestrzeni jednowymiarowej

Wprawdzie często nie znamy sił działających podczas zderzenia ale wiemy, że musi być spełniona zasada zachowania pędu (siły zewn. = 0), oraz zasada zachowania energii całkowitej. Wobec tego nawet nie znając szczegółów oddziaływania można w wielu przypadkach stosując te zasady przewidzieć wynik zderzenia.

Zderzenia klasyfikujemy zwykle na podstawie tego, czy energia kinetyczna jest zachowana podczas zderzenia czy też nie. Jeżeli tak to zderzenie nazywamy sprężystym, jeżeli nie to niesprężystym.

Jedyne prawdziwe zderzenia sprężyste (chociaż nie zawsze) to zderzenia między atomami, jądrami i cząsteczkami elementarnymi. Zderzenia między ciałami są zawsze w pewnym stopniu niesprężyste chociaż czasami możemy je traktować w przybliżeniu jako sprężyste. Kiedy dwa ciała po zderzeniu łączą się mówimy, że zderzenie jest całkowicie niesprężyste. Np. zderzenie między pociskiem i drewnianym klockiem gdy pocisk wbija się w klocek.

Rozpatrzmy teraz zderzenie sprężyste w przestrzeni jednowymiarowej. Wyobraźmy sobie dwie gładkie nie wirujące kule, poruszające się wzdłuż linii łączącej ich środki. Masy kul m1 i m2, prędkości przed zderzeniem v1 i v2 a po zderzeniu u1 i u2 tak jak na rysunku poniżej.

Z zasady zachowania pędu otrzymujemy

m1v1 + m2v2 = m1u1 + m2u2 (10.5)

Ponieważ zderzenie jest sprężyste to energia kinetyczna jest zachowana (zgodnie z definicją). Otrzymujemy więc

(10.6)

Przepisujemy równanie (10.5) w postaci

m1(v1 - u1) = m2(u2 - v1) (10.7)

a równanie (10.6) w postaci

(10.8)

Dzieląc równanie (10.8) przez równanie (10.7) otrzymamy w wyniku (przy założeniu v1 ≠ u1 i v2 ≠ u2)

v1 + u1 = v2 + u2

a po uporządkowaniu

v1 - v2 = u2 - u1 (10.9)

Równanie to mówi nam, że w opisanym zderzeniu względna prędkość zbliżania się cząstek przed zderzeniem jest równa względnej prędkości ich oddalania się po zderzeniu.

Mamy do dyspozycji trzy równania (10.7), (10.8) i (10.9), a chcemy znaleźć u1 i u2. Wystarczą więc dowolne dwa. Biorąc dwa liniowe równania (10.7) i (10.9) obliczmy

(10.10)

oraz

(10.11)

Rozpatrzmy kilka interesujących przypadków:

  1. m1 = m2

wtedy u1 = v2 oraz u2 = v1

czyli cząstki wymieniły się prędkościami.

  1. v2 = 0

wtedy

oraz

  1. jeżeli jeszcze dodatkowo m1 = m2

wtedy u1 = 0 oraz u2 = v1 (wymiana prędkości)

u1 ≅ – v1 oraz u2 ≅ 0

Taka sytuacja zachodzi np. przy zderzeniu cząstki lekkiej z bardzo ciężką (spoczywającą) np. piłka uderza o ścianę.

Wtedy u1v1 oraz u2 ≅ 2v1.

Prędkość cząstki ciężkiej (padającej) prawie się nie zmienia.

Np. Neutrony w reaktorze muszą być spowalniane aby podtrzymać proces rozszczepienia. W tym celu zderzamy je z sprężyście z jądrami (spoczywającymi) spowalniacza. Gdyby w spowalniaczu były ciężkie jądra to neutrony zderzając się "odbijałyby" się nie tracąc nic z prędkości. Gdyby natomiast spowalniaczem były cząstki lekkie np. elektrony to neutrony poruszałyby się wśród nich praktycznie bez zmiany prędkości. Zatem trzeba wybrać moderator (spowalniacz) o masie jąder porównywalnej z masą neutronów.

Przy zderzeniach niesprężystych energia kinetyczna nie jest zachowana.

Różnica pomiędzy energią kinetyczną początkową i końcową przechodzi np. w ciepło lub energię potencjalną deformacji.

Przykład 1

Jaką część swej energii kinetycznej traci neutron (m1) w zderzeniu centralnym z jądrem atomowym (m2) będącym w spoczynku?

Początkowa energia kinetyczna:

Końcowa energia kinetyczna:

Względne zmniejszenie energii kinetycznej:

Ponieważ dla takiego zderzenia:

więc

  1. dla ołowiu m2 = 206 m1 więc

  2. dla węgla m2 = 12 m1 więc

  3. dla wodoru m2 = m1 więc

Wyniki te wyjaśniają dlaczego parafina, która jest bogata w wodór jest dobrym spowalniaczem (a nie ołów).

Przykład 2

Wahadło balistyczne.

Służy do pomiaru prędkości pocisków. Składa się z bloku drewnianego o masie M, wiszącego na dwóch sznurach (rysunek). Pocisk o masie m, mający prędkość poziomą v, wbija się w drewno i zatrzymuje w nim. Po zderzeniu wahadło (tzn. blok z tkwiącym w nim pociskiem) wychyla się i podnosi na maksymalną wysokość h.

Z zasady zachowania pędu otrzymujemy

mv = (m + M)u

Z zasady zachowania energii (po zderzeniu):

Po rozwiązaniu tych dwóch równań otrzymujemy:

Wystarczy więc zmierzyć wysokość h oraz masy m i M aby móc wyznaczyć prędkość pocisku v.

Na zakończenie sprawdźmy jaka część początkowej energii zostaje zachowana w tym zderzeniu. W tym celu obliczamy stosunek energii kinetycznej układu klocek – pocisk, zaraz po zderzeniu, do energii kinetycznej pocisku przed zderzeniem. Otrzymujemy

Dla typowej masy pocisku m = 5 g i klocka o masie M = 2 kg otrzymujemy stosunek m/(m+M) ≅ 0.025. Oznacza to, że zachowane zostaje tylko 0.25% początkowej energii kinetycznej, a 99.75% ulega zmianie w inne formy energii.

Wykład 11

Elementy szczególnej teorii względności

Wstęp

Mechanika klasyczna oparta na zasadach dynamiki Newtona poprawnie opisuje zjawiska, w których prędkości ciał są małe w porównaniu z prędkością światła. Jednak w zjawiskach atomowych, jądrowych i w astrofizyce spotykamy się z prędkościami zbliżonymi do prędkości światła i wtedy zamiast mechaniki klasycznej musimy stosować mechanikę relatywistyczną opartą na szczególnej teorii względności opracowanej przez Einsteina. Mechanika klasyczna nie jest sprzeczna z mechaniką relatywistyczną, a stanowi jej szczególny przypadek (dla małych prędkości).

Zasada względności

Wiemy już, że gdy układ porusza się ze stałą prędkością po linii prostej to każde doświadczenie przebiega tak samo jakbyśmy się nie poruszali. Jednocześnie jakakolwiek zmiana prędkości natychmiast jest przez nas zauważana.

Narzuca się wniosek, poparty przez niezliczone obserwacje, że żadne doświadczenie nie pozwala nam stwierdzić, że się poruszamy (v = const). Inaczej mówiąc:

Prawa przyrody (w szczególności fizyki) są takie same bez względu na to, czy obserwujemy je z układu nie poruszającego się, czy z ruchomego, ale poruszającego się bez przyśpieszenia (czyli układu inercjalnego)

Ten wniosek, nazywany obecnie zasadą względności: sformułowano jeszcze za czasów Galileusza.

Transformacja Galileusza

Omawiając zasady dynamiki Newtona stwierdziliśmy, że prawa przyrody (w szczególności fizyki) są takie same bez względu na to, czy obserwujemy je z układu nie poruszającego się, czy z ruchomego, ale poruszającego się bez przyśpieszenia (układy inercjalne).

Spróbujemy teraz opisać zjawiska widziane z dwóch różnych inercjalnych układów odniesienia, poruszających się względem siebie (rysunek). W tym celu wyobraźmy sobie, obserwatora na ziemi, który rejestruje dwa wybuchy na pewnej, jednakowej wysokości. Odległość między miejscami wybuchów wynosi, (według ziemskiego obserwatora) Δx, natomiast czas między wybuchami Δt. Te same dwa zdarzenia obserwowane są przez pasażera samolotu lecącego z prędkością V po linii prostej łączącej miejsca wybuchów. Względem lokalnego układu odniesienia związanego z lecącym samolotem różnica położeń wybuchów wynosi Δx’, a różnica czasu Δt’.

Porównajmy teraz spostrzeżenia obserwatorów na ziemi i w samolocie. Zróbmy to np. z pozycji obserwatora na ziemi, który próbuje opisać to co widzą pasażerowie samolotu.

Jeżeli, pierwszy wybuch nastąpił w punkcie x1’ (względem samolotu), a drugi po czasie Δt, to w tym czasie samolot przeleciał drogę VΔt (względem obserwatora na Ziemi) i drugi wybuch został zaobserwowany w punkcie

czyli

Jednocześnie, ponieważ samolot leci wzdłuż linii łączącej wybuchy, to Δy’ = Δz’ = 0. Oczywistym wydaje się też, że Δt’ = Δt.

Otrzymaliśmy więc wzory przekładające wyniki obserwacji jednego obserwatora na spostrzeżenia drugiego

(11.1)

Te równania noszą nazwę transformacji Galileusza

Sprawdźmy, czy stosując powyższe wzory do opisu doświadczeń, otrzymamy takie same wyniki, niezależnie od układu w którym to doświadczenie opisujemy. Jako przykład wybierzmy ciało poruszające wzdłuż osi x ruchem jednostajnie przyspieszonym z przyspieszeniem a. W układzie nieruchomym prędkość chwilowa ciała wynosi

Jego przyspieszenie jest stałe i równe a. Natomiast obserwator w pojeździe poruszającym się wzdłuż osi x ze stałą prędkością V rejestruje, że w czasie Δt’ ciało przebywa odległość Δx’. Zatem prędkość chwilowa ciała zmierzonego przez tego obserwatora wynosi

Zgodnie z transformacją Galileusza Δx' = Δ− VΔt, oraz Δt' = Δt, więc

Otrzymaliśmy prędkość względną jednego obiektu względem drugiego co jest wynikiem intuicyjnie oczywistym. Natomiast przyśpieszenie w układzie poruszającym się wynosi

Widać, że w tym przypadku zastosowanie wzorów transformacji Galileusza daje wynik zgodny z doświadczeniem. Jednak nie jest to prawdą w każdym przypadku. Miedzy innymi stwierdzono, że ta transformacja zastosowana do równań Maxwella nie daje tych samych wyników dla omawianych układów inercjalnych. W szczególności z praw Maxwella wynika, że prędkość światła jest podstawową stałą przyrody i powinna być taka sama w każdym układzie odniesienia.

Oznacza to na przykład, że gdy impuls światła rozchodzący się w próżni w kierunku x jest obserwowany przez dwóch obserwatorów (patrz na tekst i rysunek powyżej) to zarówno obserwator nieruchomy jak poruszający się z prędkością V (względem pierwszego) zmierzą identyczną prędkość impulsu = 2.998⋅108 m/s. Tymczasem zgodnie z transformacją Galileusza i ze zdrowym rozsądkiem powinniśmy otrzymać wartość
c – V. Wykonano szereg doświadczeń, w których próbowano podważyć równania Maxwella, a w szczególności próbowano pokazać, że prędkość światła, tak jak prędkość dźwięku zależy od układu odniesienia (stosuje się do transformacji Galileusza). Najsławniejsze z nich, to doświadczenie Michelsona-Morleya mające na celu wykrycie wpływu ruchu orbitalnego Ziemi na prędkość światła poprzez pomiar prędkości światła w kierunku prostopadłym i równoległym do ruchu Ziemi. Wszystkie te doświadczenia dały wynik negatywny i musimy uznać, że prędkość światła w próżni jest jednakowa we wszystkich inercjalnych układach odniesienia.

Prędkość światła c = 2.988⋅108 m/s we wszystkich układach odniesienia.

Rozpatrzmy teraz niektóre wnioski wynikające ze staości prędkości świata.

Dylatacja czasu

Załóżmy, że w rakiecie znajduje się przyrząd wysyłający impuls świata z punktu A, który następnie odbity przez lustro Z, odległe od A o d powraca do punktu A, gdzie jest rejestrowany (rysunek).

Czas Δt' jaki upływa między wysłaniem świata, a jego zarejestrowaniem przez obserwatora będącego w rakiecie jest oczywiście równy Δt' = 2d/c (rysunek po lewej stronie). Teraz to samo zjawisko opisujemy z układu nieruchomego, względem którego rakieta porusza się w prawo z prędkością V. Chcemy, w tym układzie, znaleźć czas Δt przelotu świata z punktu A do zwierciadła i z powrotem do A.

Jak widać na rysunku (po prawej stronie) światło przechodząc od punktu A do zwierciadła Z porusza się po linii o długości S

Zatem czas potrzebny na przebycie drogi AZA (tj. dwóch odcinków S) wynosi

lub po przekształceniu

(11.2)

Widzimy, że warunek stałości prędkości świata w różnych układach odniesienia może być spełniony tylko wtedy gdy, czas pomiędzy dwoma zdarzeniami obserwowanymi i mierzonymi z różnych układów odniesienia jest różny.

W konsekwencji, każdy obserwator stwierdzi, że poruszający się zegar idzie wolniej niż identyczny zegar w spoczynku.

To zjawisko dylatacji czasu jest własnością samego czasu i dlatego spowolnieniu ulegają wszystkie procesy fizyczne gdy są w ruchu. Dotyczy to również reakcji chemicznych, więc i np. biologicznego starzenia się.

Dylatację czasu zaobserwowano doświadczalnie min. za pomocą nietrwałych cząstek. Cząstki takie przyspieszano do prędkości bliskiej prędkości światła i mierzono zmianę ich czasu połowicznego zaniku.

Transformacja Lorentza

Szukamy ponownie (jak w przypadku transformacji Galileusza) wzorów przekładających spostrzeżenia jednego obserwatora na obserwacje drugiego. Chcemy znaleźć transformację współrzędnych ale taką, w której obiekt poruszający się z prędkością równą c w układzie nieruchomym (xyzt), również w układzie (x', y', z', t') poruszającym się z prędkością V wzdłuż osi x będzie poruszać się z prędkością c.

Transformacja współrzędnych, która uwzględnia niezależność prędkości światła od układu odniesienia ma postać

(11.3)

gdzie β V/c. Te równania noszą nazwę transformacji Lorentza.

Omówimy teraz niektóre wnioski wynikające z transformacji Lorentza.

Jednoczesność

Przyjmijmy, że według obserwatora w rakiecie poruszającej się wzdłuż osi x' (czyli także wzdłuż osi x, bo zakładamy, e te osie s równoległe) pewne dwa zdarzenia zachodzą równocześnie Δt' = t2' ‑ t1' = 0, ale w rożnych miejscach x2' ‑ x1' = Δx' ≠ 0. Sprawdźmy, czy te same zdarzanie są również jednoczesne dla obserwatora w spoczynku. Z transformacji Lorentza wynika, że

Łącząc oba powyższe równania otrzymujemy związek

(11.4)

Jeżeli teraz uwzględnimy fakt, że zdarzenia w układzie związanym z rakietą są jednoczesne Δt' = 0 to otrzymamy ostatecznie

(11.5)

Widzimy, że równoczesność zdarzeń nie jest bezwzględna, w układzie nieruchomym te dwa zdarzenia nie są jednoczesne.

Skrócenie długości

Teraz rozpatrzmy inny przykład. W rakiecie poruszającej się z prędkością V, wzdłuż osi x' leży pręt o długości L'. Sprawdźmy jaką dugość tego pręta zaobserwuje obserwator w układzie nieruchomym.

Pomiar dugości pręta polega na zarejestrowaniu dwóch zjawisk zachodzących równocześnie na końcach pręta (np. zapalenie się żarówek). Ponieważ żarówki zapalają się na końcach pręta to Δx' = L'. Ponadto żarówki zapalają się w tym samym czasie (dla obserwatora w układzie spoczywającym ) to dodatkowo Δ= 0. Uwzględniając te warunki otrzymujemy na podstawie transformacji Lorentza

Δx jest długością pręta L w układzie nieruchomym więc

(11.6)

Okazuje się, że pręt ma mniejszą dugość, jest krótszy.

Stałość przedziału czasoprzestrzennego

Pomimo, że powyższy opis kłóci się ze zdrowym rozsądkiem i doświadczeniem życia codziennego to jednak po bliższej analizie transformacja Lorentza może już nie wydawać się aż tak dziwna. Wyobraźmy sobie pręt o dł. np. .20m. umieszczony w układzie współrzędnych w taki sposób, że rzut tego odcinka na oś x wynosi Δx, a na oś y Δy.

Jeśli teraz ktoś znajdzie się w drugim układzie współrzędnych, obróconym względem pierwszego o kąt α, to spoglądając na ten odcinek z tego układu mierzy jego współrzędne jako Δx i Δy. Czy jest to dla nas dziwne? Oczywiście nie. Możemy także przetłumaczyć opis w jednym układzie na opis w drugim (znaleźć transformację)

Δxx cosα + Δy sinα

Δy=-Δx sinα + Δy cosα

Poszczególne wyniki obserwacji Δx i Δy dla jednego człowieka, oraz, odpowiednio, Δx' i Δy' dla drugiego są różne, lecz suma ich kwadratów tj. długość pręta jest taka sama. Związek między Δx i Δy, a Δx' i Δy' jest dany przez liniową kombinację podobnie jak w transformacji Lorentza. Tylko, że tutaj wiemy, że Δx i Δy to odległości, a tam Δx i Δt to wielkości innego rodzaju.

Szczególna teoria względności dowodzi, że czas jest ściśle powiązany z odległością i naprawdę żyjemy w 4‑wymiarowej przestrzeni; czasoprzestrzeni. Co więcej, podobna wielkość jak odległość w naszym przykładzie też istnieje: jest nią przedział czasoprzestrzennyx)2-(cΔt)2, który jest niezmiennikiem transformacji Lorenzta, czyli jest taki sam w dwóch układach

x)2-(cΔt)2=(Δx’)2-(cΔt’)2 (11.7)

Dodawanie prędkości

Uprzednio rozważaliśmy obiekt spoczywający w rakiecie. Teraz zajmiemy się przypadkiem gdy obiekt ma już pewną prędkość Ux' w ruchomym układzie odniesienia (tj. względem rakiety). Sprawdzimy jaką prędkość Ux zarejestruje nieruchomy obserwator, w układzie którego rakieta porusza się z prędkością V wzdłuż osi x. Z transformacji Lorentza wynika, że

Dzieląc te równania przez siebie otrzymujemy

a po podstawieniu

i

(11.8a)

Równanie (11.8a) można rozwiązać ze względu na Ux

(11.8b)

W ogólności, jeśli obiekt przesuwa się z prędkością , względem obserwatora w rakiecie (poruszającej się z prędkością U wzdłuż osi x) to prędkość tego przedmiotu zarejestrowana w nieruchomym układzie wyniesie

(11.9a)

Vy = Vy' (11.9b)

Przykład 1

Dwa naddźwiękowe samoloty odrzutowe lecą ku sobie na kursie kolizyjnym. Ich prędkości względem Ziemi wynoszą odpowiednio: samolot 1 Vx = 1500km/h, samolot 2 U = 3000km/h. Jaką wartość prędkości pierwszego samolotu zmierzy obserwator w samolocie drugim?

Samolot 2 jest układem, względem którego prędkość obiektu (czyli samolotu 1) chcemy obliczyć, przy znanej prędkości w układzie związanym z Ziemią. Ponieważ Vx = 1500 km/h, U = ‑ 3000 km/h (bo przeciwny kierunek). stąd na podstawie równania (11.9a) Vx' = 4497.77 km/h.

Zależność masy od prędkości

Dotychczas zajmowaliśmy się kinematyką ruchu ciała obserwowanego z dwóch układów odniesienia poruszających się względem siebie ze stałą prędkością. Teraz chcemy odpowiedzieć na pytanie jak można opisać zachowanie ciała pod wpływem sił w sytuacji, gdy transformacja Lorentza, (a nie Galileusza) jest prawdziwa. Chodzi o to, czy druga zasada dynamiki Newtona = dp/dt może być stosowana i czy zasada zachowania pędu ma taką samą postać we wszystkich układach inercjalnych.

Okazuje się, że warunkiem zachowania pędu przy transformacji z jednego układu odniesienia do innego jest uwzględnienie zależność masy ciała m od jego prędkości V, danej następującym wyrażeniem

(11.10)

w którym m0 oznacza masę spoczynkową, czyli masę nieruchomego ciała. Zauważmy ponadto, że masa cząstki rośnie wraz z prędkością i zmierza do nieskończoności gdy V  c.

Rozpatrzmy teraz ruch ciała pod wpływem stałej siły F działającej równolegle do kierunku ruchu. Zależność prędkości ciała od czasu obliczamy na podstawie drugiej zasad dynamiki Newtona. Uwzględniając zależność masy od prędkości (11.10) otrzymujemy

Porównanie zależność prędkości ciała od czasu działania siły w mechanice klasycznej i relatywistycznej jest pokazane na rysunku poniżej.

W przeciwieństwie do opisu klasycznego, z powyższej zależności wynika, że cząstki nie da się przyspieszać w nieskończoność działając stałą siłą.

Zmiana masy z prędkością została potwierdzona wieloma doświadczeniami przeprowadzonymi dla cząstek elementarnych.

Równoważność masy i energii

Einstein pokazał, że zasada zachowania energii jest spełniona w mechanice relatywistycznej pod warunkiem, że pomiędzy masą i całkowitą energią ciała zachodzi związek

(11.11)

gdzie m zależy od prędkości ciała V zgodnie zrównaniem (11.10). To znane powszechnie równanie Einsteina opisuje równoważność masy i energii. Wynika z niego, że ciało w spoczynku ma zawsze pewną energię związaną z jego masa spoczynkową

Energię kinetyczną ciała poruszającego się z prędkością V obliczamy odejmując od energii całkowitej energię spoczynkową (nie związaną z ruchem)

Widzimy, że mechanika relatywistyczna wiąże energię kinetyczną z przyrostem masy ciała. Na zakończenie zobaczmy jaką wartość przyjmuje energia całkowita, jeśli prędkość V jest mała. Dla małego V równanie (11.10) można przybliżyć (rozwijając w szereg) do postaci

Podstawiając tę wartość do wyrażenia na energię całkowitą otrzymujemy

Pierwszy wyraz jest energią związaną z istnieniem samej masy (energia spoczynkowa) natomiast drugi jest klasyczną energią kinetyczną związaną z ruchem ciała. Otrzymaliśmy rozwiązanie klasyczne jako graniczny przypadek (dla małych prędkości) rozwiązania relatywistycznego.

Stąd o krok już było do stwierdzenia, że jeżeli masa spoczynkowa cząstki zostanie zmniejszona o Δm, to nastąpi wyzwolenie energii ΔE = Δmc2. Te wnioski zostały potwierdzone doświadczalnie i omówimy je na dalszych wykładach.

Wykład 12

Ruch obrotowy

Wstęp

Mówiąc o środku masy wspominaliśmy o ruchu obrotowym oraz o toczeniu się ciał. Dużym ułatwieniem w analizie układów cząstek jest możliwość rozpatrywania oddzielnego ruchu postępowego i ruchu obrotowego. Aby wprowadzić to uproszczenie zdefiniujemy dwie nowe wielkości: moment pędu i moment siły. Zasada zachowania momentu pędu jest równie istotna jak zasada zachowania pędu i zasada zachowania energii.

Kinematyka ruchu obrotowego

Musi w pierwszym kroku wypracować ujęcie matematyczne dla ruchu obrotowego. Dla ruchu obrotowego wielkością analogiczną do przesunięcia jest przesunięcie kątowe θ. Kąt θ określa położenie punktu względem układu odniesienia. Dla ruchu po okręgu, z definicji miary łukowej kąta θ = S/R. (w radianach).

Kątową analogią prędkości v = dx/dt jest prędkość kątowa ω.

(12.1)

Dla ruchu po okręgu v = ω R.

W przypadku ruchu jednostajnego po okręgu ω jest nazywane częstością kątową i jest związana z częstotliwością f relacją

ω = 2πf

Podobnie jak przyspieszenie liniowe a = dv/dt zostało zdefiniowane przyspieszenie kątowe α.

(12.2)

Dla ruchu po okręgu związek pomiędzy a i α jest analogiczny do związku pomiędzy vω tzn. a = αR. Możemy teraz np. podać opis ruchu obrotowego ze stałym przyspieszeniem α poprzez analogię do ruchu postępowego jednostajnie zmiennego.

Ruch postępowy Ruch obrotowy

a = const

v = v0 + at

s = s0 + v0t + (1/2)at2

α = const

ω = ω0 + αt

θ =θ0 + ω0t + (1/2)αt2

Kierunek i zwrot wektorów prędkości kątowej ω i przyspieszenia kątowego α w ruchu obrotowym przyspieszonym (1) i opóźnionym (2) są pokazane na rysunku poniżej.

Dynamika ruchu obrotowego

Moment siły

W ruchu postępowym siłę wiążemy z liniowym przyspieszeniem ciała. Jaką wielkość będziemy wiązać z przyspieszeniem kątowym?

Nie może być to tylko siła bo jak pokazuje doświadczenie np. z otwieraniem drzwi przyspieszenie kątowe zależy od tego gdzie i pod jakim kątem jest przyłożona siła. W szczególności siła przyłożona w miejscu zawiasów zarówno wzdłuż jak i prostopadle do nich nie wytwarza żadnego przyspieszenia. Natomiast siła przyłożona do drzwi na ich zewnętrznej krawędzi i pod kątem prostym nadaje im maksymalne przyspieszenie.

Dla ruchu obrotowego odpowiednikiem siły w ruchu postępowym jest moment siły (tzw. moment obrotowy) τ.

Jeżeli siła F działa na cząstkę to moment siły jest definiowany jako

(12.3)

gdzie wektor r reprezentuje położenie cząstki względem wybranego inercjalnego układu odniesienia. Moment siły jest wielkością wektorową, której wartość bezwzględna wynosi: τ = rFsinθ (iloczyn wektorowy). Wielkość r nazywamy ramieniem siły (widać, że bierzemy albo r albo F).

Moment pędu

Zdefiniujmy teraz wielkość, która w ruchu obrotowym odgrywa rolę analogiczną do pędu. Wielkość L będziemy nazywać momentem pędu i definiujemy ją

(12.4)

gdzie p jest pędem cząstki, a r reprezentuje położenie cząstki względem wybranego inercjalnego układu odniesienia. Wartość L wynosi rpsinθ i analogicznie do momentu siły wielkość rsinθ nazywamy ramieniem pędu.

Istnieje bezpośrednia zależność pomiędzy momentem siły i momentem pędu. Zacznijmy od znanej zależności, że siła F = dp/dt (dla pojedynczej cząstki). Mnożąc wektorowo obie strony przez r otrzymujemy

jest momentem siły τ więc

(12.5)

Teraz przechodzimy do równania na moment pędu L = r×p i różniczkujemy je obustronnie względem czasu, otrzymując

ponieważ dr/dt = v więc

Wiemy, że = 0 (z definicji iloczynu wektorowego), więc

(12.6)

Porównanie równań (12.5) i (12.6) prowadzi do wniosku, że

(12.7)

Widzimy, że wypadkowy moment siły działający na cząstkę jest równy prędkości zmian momentu pędu tej cząstki.

Zachowanie momentu pędu

Dla układu n cząstek możemy zsumować równanie (12.7) po wszystkich cząstkach

(12.8)

Zauważmy, że jeżeli na układ nie działa zewnętrzny moment siły (lub suma = 0) to moment pędu układu pozostaje stały.

Przykład 1

Osoba stoi na stoliku obrotowym i w obu rękach trzyma hantle, mając rozłożone ramiona. Popychamy ją, tak aby obracała się z częstotliwością f1 = 0.5 obrotów na sekundę. Wtedy osoba zgina ramiona, przyciągając hantle do tułowia. Jaka jest częstotliwość jej obrotów? Załóżmy, że hantle początkowo znajdujące się 80 cm od osi obrotu, zostają ściągnięte do odległości 10 cm od osi. Masa hantli jest taka, że obracająca się osoba ma taki sam moment pędu jak hantle w odległości 80 cm od osi obrotu.

Początkowo moment pędu hantli wynosi

Lh1 = R1mv1 = R1m(ω1R1) = mω1(R1)2

gdzie m jest masą pary hantli. Moment pędu układu osoba‑hantle wynosi więc

L1 = Lo1 + 1(R1)2

Ponieważ Lo1 = Lh1 więc Lo1 = 1(R1)2.

Dla hantli w odległości R2 moment pędu układu wynosi

L2 = Lo2 + 2(R2)2

Stosując zasadę zachowania pędu otrzymujemy

L1 = L2

czyli:

Lo1 + 1(R1)2 = Lo2 + 2(R2)2

Pamiętając, że Lo2 = Lo1ω2/ω1 ponieważ Lω rozwiązujemy to równanie względem ω2

ω2 = 1.97 ω1

Prędkość obrotów rośnie dwukrotnie.

Przykład 2

Rower jedzie ze stałą prędkością gdy siła działająca pomiędzy nawierzchnią i kołem F2 = 4 N. Z jaką siłą F1 łańcuch musi ciągnąć zębatkę jeżeli stosunek R2/R1 = 10?

Ponieważ prędkość kątowa jest stała więc dL/dt = 0 i co za tym idzie

τwypadkowy = (τ1 - τ2) = 0

czyli

τ1 = τ2

Stąd

R1F1 = R2F2

więc

F1 = (R2/R1)F2 = 40N

Ciała sztywne i moment bezwładności

Większość mas w przyrodzie to nie cząstki tylko rozciągłe ciała stałe, które mogą wykonywać zarówno ruch postępowy jak i obrotowy. Przez ciała stałe, sztywne, rozumiemy ciała, w których odległość między dwoma wybranymi elementami pozostaje stała.

Przeanalizujmy ruch takiej bryły obracającej się ze stałą prędkością kątowa ω wokół stałej osi w układzie środka masy (rysunek). Zauważmy, że różne części ciała mają różną prędkość liniową v chociaż tą samą kątową ω. Dla potrzeb opisu ciało możemy podzielić na elementy o masie Δmi odległe od osi obrotu o ri. Wtedy prędkość takiego elementu wynosi vi = riω.

Wartość momentu pędu L tego ciała można obliczyć

Wielkość w nawiasie nazywamy momentem bezwładności I, który definiujemy jako

a dla ciągłego rozkładu masy mamy

(12.9)

Zwróćmy uwagę, że I zależy od osi obrotu. Możemy teraz zapisać moment pędu

L = Iω (12.10)

a ponieważ τ = dL/dt więc

(12.11)

Energia kinetyczna w układzie środka masy

więc

(12.12)

Zestawmy teraz obliczone wielkości z ich odpowiednikami dla ruchu postępowego.

Ruch postępowy Ruch obrotowy

p = mv

F = ma

Ek = (1/2) mv2

L= Iω

τ = Iα

Ek = (1/2)2

Teraz widzimy, że moment bezwładności I jest analogiczną wielkością do masy m w ruchu postępowym. Chociaż masa ciała nie zależy od jego położenia to moment bezwładności zależy od osi, wokół której obraca się ciało. Momenty bezwładności niektórych ciał są podane w tabeli.

Ciało I

Obręcz, pierścień względem osi ⊥ przez środek

Krążek, walec względem osi ⊥ przez środek

Pręt wokół osi ⊥ przez środek

Pręt wokół osi ⊥ przez koniec

Pełna kula wokół osi przez środek

Czasza kulista wokół osi przez środek

mR2

mR2/2

ml2/12

ml2/3

2mR2/5

2mR2/3

Często do obliczania momentu bezwładności wygodnie jest posłużyć się twierdzeniem Steinera. Podaje ono zależność pomiędzy momentem bezwładności I ciała względem danej osi, a momentem bezwładności Iśr.m. tego ciała względem osi przechodzącej przez jego środek masy i równoległej do danej.

I = Iśr.m. + md2 (12.13)

gdzie m jest masą ciała, a d odległością pomiędzy osiami.

Ruch postępowo-obrotowy ciała sztywnego

Rozpatrywaliśmy ruch obrotowy ciała względem osi nieruchomych. Jednakże gdy ciało się toczy to wykonuje zarówno ruch postępowy, jak i obrotowy. Dlatego też toczenie możemy traktować jako złożenie ruchu postępowego i obrotowego tak jak pokazano to na rysunku poniżej dla toczącego się walca.

W ruchu postępowym, rysunek (a), wszystkie punkty poruszają się z takimi samymi prędkościami, natomiast w ruchu obrotowym, rysunek (b), przeciwległe punkty poruszają się z przeciwnymi prędkościami, a środek jest nieruchomy. Na rysunku (c) pokazano wynik złożenia (sumowania) odpowiednich wektorów z rysunków (a) i (b).

Zwróćmy uwagę, że podstawa walca (punkt P styczności z podłożem na rysunku poniżej) w każdej chwili spoczywa (v = 0). Natomiast prędkość liniowa każdego innego punktu jest w każdej chwili prostopadła do linii łączącej ten punkt z podstawą P i proporcjonalna do odległości tego punktu od P. Oznacza to, że walec obraca się wokół punktu P. Oznacza to, że możemy toczenie opisywać również jako "czysty" ruch obrotowy ale względem osi przechodzącej przez punkt P styczności z powierzchnią, po której toczy się ciało.

Przykład 3

Krążek i kula o masach m i promieniach R staczają się po równi pochyłej o wysokości h Obliczyć ich prędkości u dołu równi.

Z zasady zachowania energii

mgh = (1/2)mv2 + (1/2)2

Ponieważ ω = v/R więc

mgh = (1/2)mv2 + (1/2)I(v/R)2

Przekształcając

Dla krążka I = mR2/2 więc

podczas gdy dla kuli I = 2mR2/5 więc

Zauważmy, że odpowiedź nie zależy od masy i promienia ale zależy tylko od kształtu. Gdyby te ciała zsuwały się (bez tarcia) to dla obu brył.

Ten sam przykład możemy rozwiązać traktując toczenie wyłącznie jako ruch obrotowy ale wtedy musimy skorzystać z twierdzenia Steinera, żeby obliczyć moment bezwładności względem osi przechodzącej przez punkt styczności z powierzchnią.

Ruch precesyjny (bąk)

Inny przykładem ruchu obrotowego, w którym oś obrotu nie jest nieruchomą w inercjalnym układzie odniesienia jest bąk wirujący dookoła pewnej osi symetrii. Punkt podparcia bąka znajduje się w początku inercjalnego układu odniesienia. Z doświadczenia wiemy, że oś wirującego bąka porusza się dookoła osi pionowej, zakreślając powierzchnię stożka. Taki ruch nazywamy precesją.

W sytuacji przedstawionej na rysunku poniżej bąk ma prędkość kątową ω dookoła swej osi. Ma również moment pędu L względem tej osi, która tworzy kąt θ z osią pionową.

Na bąk działają dwie siły: siła w punkcie podparcia działa w górę i siła ciężkości przyłożona do środka masy działa w dół. Siła reakcji działająca w górę ma zerowy moment bo ma zerowe ramię (względem punktu podparcia). Ciężar mg wytwarza jednak moment siły względem punktu podparcia:

τ = r×F = r×mg

gdzie r określa położenie środka masy. Z iloczynu wektorowego wynika, że τ jest prostopadłe do r i do mg.

Zauważmy, że τ, L i r wirują dokoła osi pionowej z częstością precesji ωp.

Obliczymy teraz kątową precesję ωp.

Ponieważ ΔL << L, to mamy

Δϕ ≅ ΔL/Lsinθ

Z równania (12.5) wynika, że

ΔL = τΔt

więc

ΔϕτΔt/Lsinθ

Otrzymujemy więc

ωp = Δϕt = τ/Lsinθ (12.14)

Moment siły jest równy

τ = rmg sin(180°‑θ) = rmg sinθ

więc ostatecznie

ωp = rmg/L (12.15)

Zwróćmy uwagę, że prędkość precesji nie zależy od kąta θ i jest odwrotnie proporcjonalna do wartości momentu pędu.

Równanie (12.14) można zapisać w postaci wektorowej. Najpierw przepisujemy je do postaci

τ = ωpL sinθ

Widać, że po prawej stronie równania otrzymaliśmy wartość iloczynu wektorowego ωp×L. Tak więc ostatecznie wyrażenie wiążące prędkość kątową precesji z momentem siły i momentem pędu ma postać

(12.16)

Zjawisko precesji momentu magnetycznego (spinu) jest podstawą różnych technik doświadczalnych (NMR, EPR), które znalazły szerokie zastosowanie w badaniach, technice i medycynie.

Wykład 13

Ruch drgający

Ruch, który powtarza się w regularnych odstępach czasu, nazywamy ruchem okresowym (periodycznym). Przemieszczenie cząstki w ruchu periodycznym można wyrazić za pomocą funkcji sinus i cosinus. Ruch sinusoidalny jest powszechną formą ruchu obserwowaną w życiu codziennym i dlatego jest ważnym przedmiotem fizyki.

Siła harmoniczna

Działającą na ciało siłę, która jest proporcjonalna do przesunięcia ciała od początku układu i która jest skierowana ku początkowi układu, nazywamy siłą harmoniczną lub siłą sprężystości. Jeżeli obierzemy oś x wzdłuż przesunięcia, to siła harmoniczna jest wyrażona równaniem

F = – kx (13.1)

gdzie x jest przesunięciem od położenia równowagi. To równanie opisuje siłę wywieraną przez rozciągniętą sprężynę o ile tylko sprężyna nie została rozciągnięta poza granicę sprężystości. To jest prawo Hooke'a.

Jeżeli sprężyna zostanie rozciągnięta tak aby masa m (zaczepiona do sprężyny) znalazła się w położeniu x = A, a następnie w chwili t = 0 została zwolniona, to położenie masy w funkcji czasu będzie dane równaniem

x = Acosωt

Sprawdźmy czy to jest dobry opis ruchu. Dla t = 0, x = A tzn. opis zgadza się z założeniami. Z drugiej zasady dynamiki Newtona wynika, że

– kx = ma

czyli

– kx = m(dv/dt)

wreszcie

kx = m(d2x/dt2) (13.2)

Równanie takie nazywa się równaniem różniczkowym drugiego rzędu. Staramy się "odgadnąć" rozwiązanie i następnie sprawdzić nasze przypuszczenia. Zwróćmy uwagę, że rozwiązaniem jest funkcja x(t), która ma tę właściwość, że jej druga pochodna jest równa funkcji ale ze znakiem "–". Zgadujemy, że może to być funkcja x = Acosωt i sprawdzamy

dx/dt = v = – sinωt (13.3)

d2x/dt2 = a = – 2cosωt (13.4)

Podstawiamy ten wynik do równania (13.2)

(– kAcosωt) = m(– 2cosωt)

i otrzymujemy

ω2 = k/m (13.5)

Widzimy, że x = Acosωt jest rozwiązaniem równania (13.2) ale tylko gdy .

Zwróćmy uwagę, że funkcja x = Asinωt jest również rozwiązaniem równania ale nie spełnia warunku początkowego bo gdy t = 0 to x = 0 (zamiast x = A).

Najogólniejszym rozwiązaniem jest

x = Asin(ωt + ϕ) (13.6)

gdzie ϕ jest dowolną stałą fazową. Stałe A i ϕ są określone przez warunki początkowe.

Wartości maksymalne (amplitudy) odpowiednich wielkości wynoszą:

Funkcja cosωt lub sinωt powtarza się po czasie T dla którego ωT = 2π. Ta szczególna wartość czasu jest zdefiniowana jako okres T

T = 2π/ω (13.7)

Liczba drgań w czasie t jest równa

n = t/T

Gdy podzielimy obie strony przez t, otrzymamy liczbę drgań w jednostce czasu

Lewa strona równania jest z definicji częstotliwością drgań f

Dla ruchu harmonicznego więc otrzymujemy

(13.8)

Jest to okres drgań masy m przyczepionej do końca sprężyny o stałej sprężystości k.

Przykład 1

Dwie masy, m1 i m2, są przyczepione do przeciwnych końców sprężyny. Jaki będzie okres drgań, gdy rozciągniemy sprężynę, a następnie zwolnimy obie masy jednocześnie? Stała sprężyny wynosi k.

Niech x1 będzie przesunięciem masy m1 od położenia równowagi, a x2 odpowiednim przesunięciem masy m2. Zauważmy, że środek masy musi pozostawać nieruchomy.

Zatem

m1x1 = – m2x2, czyli

Zastosujmy teraz do wybranej masy np. m2 równanie Fwypadkowa = ma. Siłą wypadkową, działającą na m2 jest siła F = – k (x2x1) gdzie (x2x1) jest wypadkowym rozciągnięciem sprężyny.

Podstawiamy teraz zamiast x1 i otrzymujemy

czyli

więc

gdzie µ = m1m2/(m1 + m2) jest z definicji masą zredukowaną. To jest równanie jakie już rozwiązywaliśmy, w którym zamiast x jest x2 a zamiast m jest µ.

Tak więc czyli

Zwróćmy uwagę, że okres drgań harmonicznych T jest niezależny od amplitudy drgań A (o ile jest spełnione prawo Hooke'a). Tę właściwość drgań harmonicznych prostych zauważył Galileusz i wykorzystał ją do skonstruowania zegara wahadłowego.

  1. Wahadła

    1. Wahadło proste

Wahadło proste jest to wyidealizowane ciało o masie punktowej, zawieszone na cienkiej, nieważkiej, nierozciągliwej nici. Kiedy ciało wytrącimy z równowagi to zaczyna się ono wahać w płaszczyźnie poziomej pod wpływem siły ciężkości. Jest to ruch okresowy. Znajdźmy okres tego ruchu.

Rysunek przedstawia wahadło o długości l i masie m, odchylone o kąt θ od pionu. Na masę m działają: siła przyciągania grawitacyjnego mg i naprężenia nici N. Siłę mg rozkładamy na składową radialną i styczną. Składowa styczna jest siłą przywracającą równowagę układu i sprowadza masę m do położenia równowagi. Siła ta wynosi

F = mgsinθ

Podkreślmy, że siła jest proporcjonalna do sinθ, a nie do θ, więc nie jest to ruch prosty harmoniczny. Jeżeli jednak kąt θ jest mały (mniejszy niż 10°) to sinθ jest bardzo bliski θ (różnica mniejsza niż 0.5%). Przemieszczenie wzdłuż łuku (z miary łukowej kąta) wynosi . Przyjmując zatem, że sinθθ otrzymujemy

F jest więc proporcjonalna do przemieszczenia (ze znakiem "–"). Jest to kryterium ruchu harmonicznego. Stała mg/l określa stałą k w równaniu F = – kx. Przy małej amplitudzie okres wahadła prostego wynosi więc

(13.9)

Zauważmy, że okres wahadła nie zależy od amplitudy i od masy wahadła.

Wahadło fizyczne

Dowolne ciało sztywne zawieszone tak, że może się wahać wokół pewnej osi przechodzącej przez to ciało nazywamy wahadłem fizycznym.

P jest punktem zawieszenia ciała, a punkt S, znajdujący się w odległości l od punkt P, jest środkiem masy. Moment siły τ działający na ciało wynosi

τ = – mglsinθ

Korzystając ze związku

τ = Iα =I(d2θ /dt2)

otrzymujemy

Dla małych wychyleń, dla których sinθθ dostajemy równanie

To równanie ma tę samą postać co równanie dla ruchu harmonicznego więc

lub

(13.10)

Jako przypadek szczególny rozpatrzmy masę punktową zawieszoną na nici o długości l. Wówczas I = ml2 i otrzymujemy znany wzór dla wahadła prostego

Wahadło fizyczne stosuje się do precyzyjnych pomiarów przyspieszenia g.

Energia ruchu harmonicznego prostego

Energią potencjalną sprężyny zajmowaliśmy się na wykładzie 6 przy okazji dyskusji o pracy wykonywanej przez siły zmienne. Pokazaliśmy wtedy, że energia potencjalna (nagromadzona) sprężyny

(13.11)

Jeżeli masę przymocowaną do sprężyny pociągniemy na odległość x = A to energia układu (nagromadzona w układzie) jest równa (1/2)kA2 (Ek = 0). Jeżeli teraz zwolnimy sprężynę, to przy założeniu, że nie ma tarcia ani sił oporu, zgodnie z zasadą zachowania energii w dowolnej chwili suma energii kinetycznej i potencjalnej równa się (1/2)kA2

(13.12)

stąd

Ponieważ k/m = ω2 więc

Obliczmy teraz wartości średnie czasowe) energii potencjalnej i kinetycznej. (Wartości średnie oznaczamy kreską umieszczoną ponad symbolem.)

czyli

Natomiast

czyli

Wartość średnia jest taka sama jak i wynosi 1/2. Oba wykresy są takie same (tylko przesunięte). Poza tym sin2ωt + cos2ωt = 1 i średnia każdego składnika jest taka sama. Widać, że

(Ważne gdy będziemy omawiać ciepło właściwe.)

Przykład 2

Obliczmy jaką część energii całkowitej stanowi energia potencjalna, a jaką energia kinetyczna ciała, kiedy znajduje się ono w połowie drogi między położeniem początkowym, a położeniem równowagi?

x = A/2

więc

Ep = kx2/2 = kA2/8

Ponieważ energia całkowita

E = kA2/2

więc

Ep/E = 1/4

Ponieważ

E = Ep + Ek

więc

Ek/E = 3/4

Oscylator harmoniczny tłumiony

Dotychczas pomijaliśmy fakt ewentualnego tłumienia oscylatora tzn. strat energii układu oscylatora.

W przypadku drgań mechanicznych siłą hamującą (tłumiącą) ruch cząstki jest siła oporu Fop ośrodka. Siła oporu ma zwrot przeciwny do prędkości i w najprostszej postaci jest wprost proporcjonalna do prędkości Fopv czyli

Fop = γ dx/dt (13.13)

Gdy działa tylko siła tłumienia to

lub

Jeżeli wprowadzimy zmienną (o wymiarze czasu)

τ = M/γ

to otrzymamy równanie

dv/dt = – (1/τ)v

co można przepisać w postaci

dv/v = – dt/τ

Całkujemy to równanie obustronnie

Skąd otrzymujemy

lnv - lnv0 = – (t/τ)

lub

ln(v/v0) = – (t/τ)

a po przekształceniu

(13.14)

Prędkość maleje wykładniczo z czasem czyli prędkość jest tłumiona ze stałą czasową τ (rysunek).

Jeżeli włączymy siłę hamującą do oscylatora to wówczas równanie ruchu przyjmie postać

Wprowadzając τ = M/γ oraz oznaczając częstość drgań nietłumionych ω02 = (k/M) otrzymujemy

(13.15)

Szukamy rozwiązania w postaci drgań okresowo zmiennych tłumionych np.

(13.16)

Rozwiązanie zawiera czynnik oscylacyjny (cosωt) i tłumiący (exp(-βt)) i jest pokazane na rysunku poniżej. Współczynnik β = 1/2τ określający wielkość tłumienia nazywamy współczynnikiem tłumienia.

Teraz obliczamy odpowiednie pochodne (13.16) i podstawiamy do równania (13.15). W wyniku rozwiązania dostajemy warunek na częstość drgań tłumionych

(13.17)

Opór zmniejsza więc (oprócz amplitudy) również i częstość

Funkcja (13.16) jest rozwiązaniem równania opisującego ruch harmoniczny tłumiony przy warunku (13.17). Widzimy, że opór zmniejsza zarówno amplitudę jak i częstość drgań, czyli powoduje spowolnienie ruchu. Wielkość tłumienia określa współczynnik tłumienia β (lub stała czasowa τ). Wykres ruchu harmonicznego tłumionego w zależności od czasu jest pokazany na rysunku

Powyższe rozważania dotyczą sytuacji "słabego tłumienia" tj. β < ω0. Gdy tłumienie wzrośnie powyżej pewnej krytycznej wartości (β = ω0) ruch nie jest ruchem drgającym ale obserwujemy, że ciało wychylone z położenia równowagi powraca do niego asymptotycznie. Takich ruch nazywamy ruchem pełzającym (aperiodycznym). Zależności wychylenia od czasu dla ruchu tłumionego krytycznie (β = ω0) i ruchu pełzającego (β > ω0) są pokazane na wykresie poniżej.

Straty mocy, współczynnik dobroci

Współczynnik dobroci Q jest definiowany jako

(13.18)

gdzie P jest średnią stratą mocy, a v częstotliwością.

Dla przypadku słabo tłumionego oscylatora harmonicznego (β << ω0) współczynnik ma w przybliżeniu wartość ω0/2β.

Kilka typowych wartości Q podano w tabeli

Oscylator Q

Ziemia dla fali sejsmicznej

Struna fortepianu lub skrzypiec

Atom wzbudzony

Jądro wzbudzone

250-400

1000

107

1012

Drgania wymuszone oscylatora harmonicznego

Jeżeli oprócz tarcia istnieje siła zewnętrzna F(t) (która ma za zadanie podtrzymywać gasnące drgania) przyłożona do oscylatora to równanie ruchu ma postać

(13.19)

albo po podstawieniu

τ = M/γ oraz ω02 = k/M

otrzymujemy

(2.20)

Ponownie ω0 jest częstością własną układu, to jest częstością drgań swobodnych gdy nie działa siła zewnętrzna i nie ma tarcia ani innych sił oporu, a τ stałą czasową związaną ze współczynnikiem tłumienia β relacją β = 1/2τ. Zauważmy ponadto, że układ jest zasilany z częstością ω różną od częstości własnej ω0.

Gdy układ jest zasilany częstością ω różną od ω0 wówczas drgania będą odbywały się z częstością siły zewnętrznej a nie z częstością własną. Siłę taką nazywamy siłą wymuszającą.

Załóżmy, że siła wymuszająca ma postać

(13.21)

gdzie α0 = F0/M.

Mamy teraz w równaniu dwie wielkości okresowo zmienne położenie x oraz siłę wymuszającą F. W najogólniejszym przypadku suma (złożenie) dwóch funkcji okresowych daje w wyniku też funkcję okresową (rysunek).

A1cosωt + A2sinωt = Asin(ωt + ϕ)

Szukamy więc rozwiązania postaci Asin(ωt + ϕ).

Musimy znaleźć amplitudę A oraz przesunięcie fazowe ϕ.

Najpierw zdefiniujmy jednak przesunięcie fazowe ϕ. Zarówno siła wymuszająca jak i wychylenie zmieniają się cyklicznie (harmonicznie) tzn. pełny cykl np. od maksimum do maksimum obejmuje 360° czyli 2π.

Przesunięcie fazowe ϕ mówi nam o jaki kąt maksimum przemieszczenia wyprzedza maksimum siły (o ile przesunięte są wykresy x(t) i F(t)).

Np. siła osiąga swoje maksimum gdy przemieszczenie jest równe zeru (i rośnie w kierunku dodatnim). Oznacza to, że x opóźnia się względem siły o π/2.

Poszukiwanie rozwiązania zaczynamy od obliczenia pochodnych

dx/dt= ωAcos(ωt + ϕ), oraz d2x/dt2 = -ω2Asin(ωt + ϕ)

Równanie ruchu ma teraz postać

(ω02 - ω2) Asin(ωt + ϕ) + (ω/τ)Acos(ωt + ϕ) = α0sinωt

Równanie to przekształcamy korzystając ze związków

sin(ωt + ϕ) = sinωt cosϕ + cosωt sinϕ

cos(ωt + ϕ) = cosωt cosϕ − sinωt sinϕ

Wtedy otrzymujemy

[(ω02ω2)cosϕ − (ω/τ)sinϕ] Asinωt + [(ω02ω2)sinϕ − (ω/τ)cosϕ] Acosωt = α0sinωt

Równanie to może być tylko spełnione gdy czynniki przy sinωt będą sobie równe, a czynnik przy cosωt będzie równy zeru. Ten ostatni warunek można zapisać jako

(13.22)

Z tego warunku znam już ϕ. Teraz możemy wyznaczyć amplitudę

(13.23)

gdzie już podstawiono za cosϕ i sinϕ. Łącząc wzory (13.22) i (13.23) otrzymujemy rozwiązanie

(13.24)

(Wygląda skomplikowanie ale to jest rozwiązanie postaci x = Asin(ωt + ϕ)).

Rezonans

Zauważmy, że chociaż drgania odbywają się z częstością w siły wymuszającej to amplituda i faza zależą od relacji pomiędzy częstością wymuszającą ω, a częstością własną ω0. W szczególności gdy częstość siły wymuszającej osiągnie odpowiednią częstotliwość, to amplituda drgań może wzrosnąć gwałtownie nawet przy niewielkiej wartości siły wymuszającej. Zjawisko to nazywamy rezonansem.

Wykres przedstawiający rezonansowy wzrost amplitudy drgań w funkcji częstości siły wymuszającej pokazany jest na rysunku poniżej dla różnych wartości współczynnika tłumienia β (β0<β1<β2<β3<β4).

Częstość rezonansową ωr i amplitudę rezonansową Ar możemy obliczyć z warunku na maksimum amplitudy drgań danej wzorem (13.23). Funkcja  A(ω) osiąga maksimum

dla częstości rezonansowej

Widać, że im mniejsze tłumienie β (dłuższy czas τ) tym większa amplituda A. Jeżeli tłumienie jest słabe (β << ω0) to wówczas maksymalna amplituda odpowiada częstości drgań własnych ωr = ω0. Jednocześnie, ten warunek odpowiada przesunięciu fazowemu ϕ = π/2 pomiędzy siłą a wychyleniem. Siła nie jest zgodna w fazie z wychyleniem. Zauważmy jednak, że moc pochłaniana przez oscylator zasilany siłą wymuszającą F zależy od prędkości

= Fv

Trzeba więc, żeby to prędkość (a nie wychylenie) była zgodna w fazie z siłą, a to oznacza, że siła musi wyprzedzać wychylenie o π/2. Gdy x = 0 to v = vmax i wtedy siła też ma być maksymalna. W punktach zwrotnych, gdzie prędkość zmienia swój kierunek, siła też musi zmienić swój kierunek (siła działa cały czas to nie są impulsy tak jak np. przy popychaniu huśtawki).

Skutki rezonansu mogą być zarówno pozytywne jak i negatywne. Z jednej strony staramy się wyeliminować przenoszenie drgań np. z silnika na elementy nadwozia w samochodzie, a z drugiej strony działanie odbiorników radiowych i telewizyjnych jest możliwe dzięki wykorzystaniu rezonansu elektrycznego. Dostrajając odbiornik do częstości nadajnika spełniamy właśnie warunek rezonansu. Zjawisko rezonansu jest bardzo rozpowszechnione w przyrodzie.

Moc absorbowana

Średnia moc absorbowana jest dana wyrażeniem

Korzystając ze wzoru (13.21), (13.22) i (13.24) otrzymujemy

(13.25)

Zależność mocy absorbowanej od częstości drgań wymuszających jest przedstawiona na rysunku poniżej.

Dla rezonansu P = (1/2) 02τ . Natomiast dobroć Q = ω0/2β jest miarą dostrojenia układu do częstości wymuszającej.

Wykład 14

Statyka i dynamika płynów

Z makroskopowego punktu widzenia powszechnie przyjęty jest podział materii na ciała stałe i płyny. Pod pojęciem substancji, która może płynąć rozumiemy ciecze i gazy. Dla ciał sztywnych, mających określony rozmiar i kształt, sformułowaliśmy mechanikę ciał sztywnych. Do rozwiązywania zagadnień z mechaniki płynów musimy wprowadzić nowy formalizm ponieważ płyny łatwo zmieniają kształt, a w przypadku gazów przyjmują objętość równą objętości naczynia. Wygodnym jest w związku z tym sformułowanie zasad dynamiki Newtona wraz z prawami opisującymi siły w szczególny sposób.

Ciśnienie i gęstość

Różnica w działaniu siły powierzchniowej na płyn i na ciało stałe polega na tym, że dla cieczy siła powierzchniowa musi być zawsze prostopadła do powierzchni płynu podczas gdy w ciele stałym może mieć dowolny kierunek. Spoczywający płyn nie może równoważyć sił stycznych (warstwy płynu ślizgałyby się po sobie) i dlatego może zmieniać kształt i płynąć. Wygodnie jest więc opisywać siłę działającą na płyn za pomocą ciśnienia p zdefiniowanego jako wartość siły prostopadłej działającej na jednostkę powierzchni. Ciśnienie jest przekazywane na sztywne ścianki naczynia, a także na dowolne przekroje płynów prostopadle do tych ścianek i przekrojów w każdym punkcie. Ciśnienie jest wielkością skalarną.

W układzie SI jednostką jest (pascal), 1 Pa = 1 N/m2. Innymi jednostkami są bar (1 bar = 105 Pa), atmosfera (1 atm = 101325 Pa), mm Hg (760 mm Hg = 1 atm).

Płyn znajdujący się pod ciśnieniem wywiera siłę na każdą powierzchnię będącą z nim w kontakcie. Rozważmy zamkniętą powierzchnię zawierającą płyn (rysunek).

Dowolny element powierzchni jest reprezentowany przez wektor S (długość równa powierzchni, kierunek prostopadły, zwrot na zewnątrz). Wtedy siła F wywierana przez płyn na ten element powierzchni wynosi

F = pS (14.1a)

Ponieważ F i S mają ten sam kierunek więc ciśnienie p można zapisać

p = F/S (14.1b)

Do opisu płynów stosujemy pojęcie gęstości ρ:

ρ = m/V (14.2)

Gęstość zależy od wielu czynników takich jak temperatura, ciśnienie. W tabeli przedstawiony jest zakres wartości gęstości spotykanych w przyrodzie.

Materiał ρ (kg/m3)

przestrzeń międzygwiezdna

najlepsza próżnia laboratoryjna

powietrze (1 atm 0 °C)

powietrze (50 atm 0 °C)

Ziemia: wartość średnia

rdzeń

skorupa

Białe karły

jądro uranu

10-18 - 10-21

10-17

1.3

6.5

5.52·103

9.5·103

2.8·103

108 - 1015

1017

Zmiany ciśnienia wewnątrz nieruchomego płynu

Gdy płyn znajduje się w równowadze to jego każda część jest w równowadze. Rozpatrzmy element w kształcie cienkiego dysku znajdującego się w odległości y od poziomu odniesienia. Grubość dysku wynosi dy, a powierzchnia każdej strony wynosi S. Masa takiego elementu wynosi ρSdy, a jego ciężar ρgSdy. Przypominam, że siły działające na element są w każdym punkcie prostopadłe do powierzchni (rysunek).

Siły poziome wywołane jedynie przez ciśnienie płynu równoważą się. Siły pionowe są wywoływane nie tylko przez ciśnienie płynu ale też przez jego ciężar. Element płynu nie jest przyspieszany więc wypadkowa siła działająca nań musi być zerem. Dla zachowania równowagi w pionie trzeba więc by:

pS = (p+dp)S + ρgSdy

a stąd

Równanie to pokazuje, że ciśnienie zmienia się ze zmianą wysokości ponad pewien poziom odniesienia. Gdy wysokość rośnie tzn. dy > 0 wtedy dp < 0 tzn. ciśnienie maleje. Powodem jest ciężar warstwy płynu leżącej pomiędzy punktami, dla których mierzymy różnicę ciśnień. Dla cieczy zazwyczaj ρ jest stałe (ciecze są praktycznie nieściśliwe), różnice w wysokości nie są na tyle duże żeby uwzględniać zmiany g więc możemy dla jednorodnej cieczy zapisać powyższe równanie w postaci:

stąd

(p2p1) = -ρg(y2y1)

Jeżeli powierzchnia cieczy jest swobodna to stanowi naturalny poziom odniesienia. Aby przenieść poziom odniesienia na powierzchnię przyjmujemy y2 równe wzniesieniu tej powierzchni. Wtedy ciśnienie p2 (na powierzchni) jest równe ciśnieniu atmosferycznemu p0. Teraz y1 opisuje położenie (wysokość) pewnego poziomu w cieczy. Ciśnienie na tym poziomie oznaczmy p. Wtedy

p0p = -ρg(y2y1)

Ponieważ y2 - y1 jest głębokością h poniżej poziomu cieczy więc

p = p0 +ρgh (14.3)

Związek ten nie tylko pokazuje, że ciśnienie rośnie wraz z głębokością ale też, że jest jednakowe dla punktów o tej samej głębokości.

Dla gazów ρ jest małe i różnica ciśnień w dwóch punktach jest zazwyczaj do pominięcia i dlatego można przyjmować, że ciśnienie gazu w naczyniu jest wszędzie jednakowe. Nie jest to jednak prawdziwe, gdy mamy do czynienia ze znaczną różnicą wysokości (gdy wznosimy się w atmosferze). Ciśnienie zmienia się wtedy znacznie, zmienia się też ρ. Np. na wysokości około 6 km ciśnienie wynosi 0.5 atm. Dla porównania 6 km w głąb morza wynosi 600 atm.

Prawo Pascala i prawo Archimedesa

Na rysunku widzimy ciecz w naczyniu zamkniętym tłokiem, na który możemy działać ciśnieniem zewnętrznym p0.

W każdym punkcie A znajdującym się na głębokości h od górnej powierzchni cieczy, ciśnienie jest dane wyrażeniem

p = p0 + ρgh

Możemy powiększyć ciśnienie zewnętrzne o wartość Δp0. Ponieważ ciecze są nieściśliwe więc gęstość pozostaje praktycznie bez zmian i dlatego ciśnienie teraz wynosi

p = p0p0+ ρgh

Wynik ten został sformułowany przez Blaise Pascala i nazywa się prawem Pascala. Prawo to formułuje się następująco: ciśnienie wywierane na zamknięty płyn jest przekazywane niezmienione na każdą część płynu oraz na ścianki naczynia.

Prawo to jest konsekwencją praw mechaniki płynów podobnie jak prawo Archimedesa.

Kiedy ciało jest zanurzone w całości lub częściowo w spoczywającym płynie (cieczy lub gazie) to płyn ten wywiera ciśnienie na każdą, będącą z nim w kontakcie, część powierzchni ciała. Wypadkowa siła jest skierowana ku górze i zwie się siłą wyporu.

Ponieważ ciśnienie wywierane na ciało nie zależy od materiału, z którego zrobiono ciało więc zastąpmy w naszym rozumowaniu rozpatrywane ciało przez ten sam płyn co płyn otoczenia. Na ten płyn będzie działało to samo ciśnienie co na ciało, które zastąpił. Poza tym płyn będzie nieruchomy. Stąd działająca nań siła będzie równa ciężarowi płynu i skierowana ku górze tak, żeby ten ciężar zrównoważyć. Otrzymujemy prawo Archimedesa: ciało w całości lub częściowo zanurzone w płynie jest wypierane ku górze siłą równą ciężarowi wypartego przez to ciało płynu. Tak więc

Fwyporu = mwypartego płynu g = ρVg (14.4)

gdzie ρ jest gęstością płynu, a V objętością części zanurzonej ciała.

Pomiar ciśnienia (barometr)

Evangelista Torricelli wynalazł w 1643 r barometr rtęciowy i tym samym podał sposób pomiaru ciśnienia atmosferycznego. Barometr Torricellego składa się z rurki wypełnionej rtęcią (ρ = 13.6·103 kg/m3), którą odwracamy nad naczyniem z rtęcią tak jak na rysunku.

Ciśnienia w punktach A i B muszą być jednakowe bo punkty te są na jednakowej wysokości. Zgodnie z naszymi uprzednimi rozważaniami

pA = ρgh

podczas gdy

pB = patm

Ponieważ pA = pB więc

ρgh = patm

= 0.76 m

Mierząc wysokość słupa rtęci mierzymy wielkość ciśnienia atmosferycznego.

Przejdziemy teraz do opisu ruchu płynu (dynamika płynów).

Ogólny opis przepływu płynów

Znane są dwa podejścia do opisu ruchu płynu. Pierwsze wymaga "podzielenia" płynu na nieskończenie małe cząstki (elementy objętości) i śledzenie tych elementów. Oznacza to, że dla każdej cząstki mamy współrzędne x, y, z i ich zależność od czasu. W ten sposób skonstruować można opis ruchu płynu (Joseph Louis Lagrange koniec XVIII w).

Drugie podejście zaproponowane przez Leonharda Eulera jest bardziej wygodne. Zamiast opisywać historię każdej z cząstek określamy gęstość płynu i jego prędkość w każdym punkcie przestrzeni i w każdej chwili czasu. Czyli podajemy ρ(x,y,z,t) oraz v(x,y,z,t). Oznacza to, że koncentrujemy się na wybranym punkcie przestrzeni w pewnym czasie.

Na wstępie rozpatrzmy pewne ogólne właściwości charakteryzujące przepływ.

  1. Przepływ może być ustalony (laminarny) lub nieustalony. Ruch płynu jest ustalony, kiedy prędkość płynu v jest w dowolnie wybranym punkcie stała w czasie tzn. każda cząstka przechodząca przez dany punkt zachowuje się tak samo. Warunki takie osiąga się przy niskich prędkościach.

  2. Przepływ może być wirowy lub bezwirowy. Przepływ jest bezwirowy, gdy w żadnym punkcie cząstka nie ma wypadkowej prędkości kątowej względem tego punktu. Można sobie wyobrazić małe kółko z łopatkami zanurzone w przepływającym płynie. Jeżeli kółko nie obraca się to przepływ jest bezwirowy, w przeciwnym razie ruch jest wirowy.

  3. Przepływ może być ściśliwy lub nieściśliwy. Zazwyczaj przepływ cieczy jest nieściśliwy (stała ρ). Przepływ gazu też może być nieściśliwy tzn. zmiany gęstości są nieznaczne. Np. ruch powietrza względem skrzydeł samolotu podczas lotu z prędkością mniejszą od prędkości głosu.

  4. Przepływ może być lepki lub nielepki. Lepkość w ruchu płynów jest odpowiednikiem tarcia w ruchu ciał stałych (lepkość smarów).

W naszych rozważaniach ograniczymy się do przepływów ustalonych, bezwirowych, nieściśliwych i nielepkich. To znacznie upraszcza matematykę.

Nasze rozważania rozpoczniemy od wprowadzenia pojęcia linii prądu.

W przepływie ustalonym v jest stała w czasie w danym punkcie. Rozważmy punkt P wewnątrz płynu. Każda cząstka ma tam taką samą prędkość. To samo dla punktów QR. Jeżeli prześledzimy tor jednej cząstki to prześledziliśmy zarazem tor każdej cząstki przechodzącej przez P. Tor tej cząstki nazywamy linią prądu. Linia prądu jest równoległa do prędkości płynu. Żadne linie prądu nie mogą się przecinać bo istniała by niejednoznaczność w wyborze drogi przez cząstkę (a przepływ jest ustalony).

Jeżeli wybierzemy pewną skończoną liczbę linii prądu to taką wiązkę nazywamy strugą prądu. Brzegi składają się z linii prądu więc płyn nie może przepływać przez brzegi strugi. Płyn wchodzący jednym końcem strugi musi opuścić ją drugim.

Na rysunku obok prędkość cząstek w punkcie P wynosi v1 a pole przekroju strugi A1. W punkcie Q odpowiednio v2 i A2. W czasie Δt element płynu prze-bywa odległość vΔt. Masa płynu przechodzącego przez A1 w czasie Δt wynosi

Δm1 = ρ1A1v1Δt

bo A1v1Δt stanowi objętość elementu płynu. Wprowadzamy strumień masy jako Δmt. Wtedy otrzymujemy dla punktów P i Q odpowiednio

Δm1t = ρ1A1v1

oraz

Δm2t = ρ2A2v2

Ponieważ nie ma po drodze (między P i Q) żadnych "źródeł" ani "ścieków" więc strumienie mas muszą być sobie równe.

ρ1A1v1 = ρ2A2v2

Jeżeli płyn jest nieściśliwy to ρ1 = ρ2 i wtedy

A1v1 = A2v2

czyli

Av = const.

Z równania powyższego wynika, że prędkość płynu nieściśliwego przy ustalonym przepływie jest odwrotnie proporcjonalna do pola przekroju. Linie prądu muszą się zagęszczać w węższej części, a rozrzedzać w szerszej. Tzn. rzadko rozmieszczone linie oznaczają obszary niskiej prędkości, linie rozmieszczone gęsto obszary wysokiej prędkości.

Ponadto warto zauważyć, że skoro cząstki zwalniają przepływając z P do Q (v1 > v2) to poruszają się ruchem jednostajnie opóźnionym. Opóźnienie to może być wywołane grawitacją lub różnicą ciśnień, ale wystarczy wziąć jako przykład strugę poziomą, w której grawitacja się nie zmienia, aby dojść do wniosku, że ciśnienie jest największe tam gdzie prędkość najmniejsza (w przepływie ustalonym).

Równanie Bernoulliego

Rozważmy nielepki, ustalony, nieściśliwy przepływ płynu przez rurę (rysunek poniżej). Ciecz na rysunku płynie w stronę prawą. W czasie Δt powierzchnia S1 przemieszcza się o odcinek v1Δt do położenia S1'. Analogicznie powierzchnia S2 przemieszcza się o odcinek v2Δt do położenia S2'. Na powierzchnię S1 działa siła F1 = p1S1 a na powierzchnię S2 siła F2 = p2S2. Zwróćmy uwagę, że efekt sumaryczny przepływu płynu przez rurkę polega na przeniesieniu pewnej objętości V płynu ograniczonej powierzchniami S1S1' do położenia S2S2'.

Twierdzenie o pracy i energii mówi, że praca wykonana przez wypadkową siłę jest równa zmianie energii układu. Siłami, które wykonują pracę są F1F2. Obliczamy więc pracę

oraz zmianę energii strugi

Ponieważ

W = ΔE

to przy założeniu nieściśliwości płynu (ρ = const)

Związek ten można przekształcić do postaci

czyli

(14.5)

Równanie to nosi nazwę równania Bernoulliego dla przepływu ustalonego, nielepkiego i nieściśliwego. Jest to podstawowe równanie mechaniki płynów. Może być stosowane do wyznaczenia prędkości płynu na podstawie pomiarów ciśnienia (rurka Venturiego, rurka Pitota). Można też w oparciu o nie wyznaczyć dynamiczną siłę nośną.

Dynamiczna siła nośna

Dynamiczna siła nośna jest to siła jaka działa na np. skrzydło samolotu, nartę wodną, śmigło helikoptera, i wywołana jest ruchem tych ciał w płynie w odróżnieniu od statycznej siły nośnej, która jest siła wyporu działającą np. na balon czy statek zgodnie z prawem Archimedesa. Na rysunku poniżej pokazane są schematycznie linie prądu wokół skrzydła samolotu.

Analizując te linie prądu zauważymy, że ze względu na ustawienie skrzydła (kąt natarcia) linie prądu nad skrzydłem są rozmieszczone gęściej niż pod skrzydłem. Tak więc vg ponad skrzydłem jest większa niż pod skrzydłem vd a to oznacza zgodnie z prawem Bernoulliego, że ciśnienie nad skrzydłem jest mniejsze od ciśnienia pod skrzydłem i otrzymujemy wypadkową siłę nośną F skierowaną ku górze. Wynika to również z trzeciej zasady dynamiki Newtona. Prędkość v0 powietrza zbliżającego się do skrzydła jest pozioma podczas gdy powietrze za skrzydłem jest skierowane na ukos w dół (składowa pionowa). Oznacza to, że skrzydło pchnęło powietrze w dół więc w reakcji powietrze pchnęło skrzydło do góry.

Wykład 15

Fale w ośrodkach sprężystych

Fale mechaniczne

Fale powstające w ośrodkach sprężystych (np. fale dźwiękowe) nazywamy falami mechanicznymi. Powstają w wyniku wychylenia jakiegoś fragmentu ośrodka z położenia równowagi co w następstwie powoduje drgania fragmentu wokół tego położenia. Drgania te (dzięki właściwościom sprężystym ośrodka) są przekazywane na kolejne części ośrodka. Sam ośrodek nie przesuwa się, a jedynie jego elementy wykonują drgania w ograniczonych obszarach przestrzeni. Np. fale na powierzchni wody: przedmioty pływające wykonują ruch drgający natomiast same fale poruszają się ruchem jednostajnym. Fala dobiegające do danego przedmiotu wprawiają go w ruch drgający przekazując mu energię. Można za pomocą fal przekazywać więc energię na duże odległości. Energia fal to energia kinetyczna i potencjalna cząstek ośrodka.

Cechą charakterystyczną fal jest to, że przenoszą energię poprzez materię dzięki przesuwaniu się zaburzenia w materii a nie dzięki ruchowi postępowemu samej materii.

Do rozchodzenia się fal mechanicznych potrzebny jest ośrodek. To właściwości sprężyste ośrodka decydują o prędkości rozchodzenia się fali.

Ze względu na kierunek drgań cząstek względem kierunku rozchodzenia się fali

  1. fale poprzeczne (np. lina)

  2. fale podłużne (np. sprężyna, głos)

Ze względu na czoło fali (powierzchnia łącząca punkty o jednakowych zaburzeniach w danej chwili) wyróżniamy

  1. fale płaskie (w jednym kierunku)

  2. fale kuliste

Fale rozchodzące się w przestrzeni

Rozważmy długi sznur naciągnięty w kierunku x, wzdłuż którego biegnie fala poprzeczna. W dowolnej chwili np. t = 0 kształt sznura można opisać funkcją

y = f(x), t = 0

y – przemieszczenie cząsteczek sznura sznura.

W miarę upływu czasu fala biegnie wzdłuż sznura bez zmiany kształtu. Po czasie t fala przesuwa się o vt w prawo (v - prędkość fali). Zatem po czasie t równanie krzywej ma postać

y = f(x − vt), t

Oznacza to, że w chwili t w punkcie x = vt, kształt jest taki sam jak w chwili t = 0 w punkcie x = 0. Mamy więc równanie fali tylko trzeba określić funkcję f.

Jeżeli śledzimy wybraną część fali (czyli określoną fazę) to musimy zbadać jak zmienia się w czasie określona wartość y (np. maksimum - amplituda). Chcemy żeby y było cały czas takie samo, więc argument x −- vt musi być taki sam, a to oznacza, że gdy czas rośnie to musi też rosnąć x (czyli ruch w prawo). Fala w lewo ma więc równanie = f(x+vt). Podsumowując, dla wybranej fazy mamy

x − vt = const.

Różniczkując względem czasu otrzymujemy

czyli

To jest prędkość fazowa. Zauważmy, że dla danego t mamy równanie f(x), a dla danego miejsca sznura x mamy równanie f(t).

Rozważmy teraz fale o szczególnym kształcie. Załóżmy, że w chwili t = 0 kształt sznura jest opisany funkcją

gdzie A jest maksymalnym wychyleniem. Zauważmy, że wychylenie jest takie samo w punktach x, x + λ, x + 2λ, x + 3λ itd. Wielkość λ nazywamy długością fali (odległość między punktami o tej samej fazie). Jeżeli fala biegnie w prawo to po czasie t

To jest równanie fali biegnącej.

Okres T jest czasem, w którym fala przebiega odległość równą λ więc:

λ = vT

stąd

(15.1)

Widać, że w danej chwili taka sama faza jest w punktach x, x + λ, x + 2λ, x + 3λ itd., oraz, że w danym miejscu faza powtarza się w chwilach t, t + T, t +2T, itd.

Często wprowadza się dwie nowe wielkości: liczbę falową k = 2π/λ i częstość ω = 2π/T. Wówczas y = Asin(kx-ωt) lub y = Asin(kx+ωt) dla fal biegnących w prawo i lewo.

Widać, że prędkość fazowa fali v jest dana wzorem

v = λ/T = ω/k (15.2)

oraz, że dla danego x otrzymujemy równanie ruchu harmonicznego prostego.

Rozchodzenie się fal, prędkość fal

Jeżeli chcemy zmierzyć prędkość fali v to śledzimy jak przemieszcza się w czasie wybrana część fali czyli określona faza.

Wiemy, że prędkość fali zależy od sprężystości ośrodka i jego bezwładności. Sprężystość dla sznura jest określona poprzez napinającą go siłę F (np. im większa siła tym szybciej wychylone elementy sznura wracają do położenia równowagi). Natomiast bezwładność jest związana z masą sznura m oraz jego długością l. Spróbujemy teraz wyprowadzić wzór na zależność prędkości v fali od siły F i od µ = m/l tj. masy przypadającej na jednostkę długości sznura. W tym celu rozpatrzmy mały wycinek sznura o długości dx pokazany na rysunku.

Końce wycinka sznura tworzą z osią x małe kąty θ1 i θ2. Dla małych kątów θ ≅ sinθ ≅ dy/dx. Wypadkowa pionowa siła tj. siła wychylająca sznur w kierunku y wynosi

Zgodnie z zasadą dynamiki siła wypadkowa jest równa iloczynowi masy wycinka dµ⋅dx i jego przyspieszenia. Stąd

lub

(Uwaga: w równaniach piszemy pochodne cząstkowe oznaczane symbolem ∂y bo wychylenie y jest funkcją dwóch zmiennych = f (x,t) i liczymy pochodne zarówno względem zmiennej x jak i zmiennej t). Uwzględniają, że θ = ∂y/∂x otrzymujemy

(15.3)

Jest to równanie falowe dla sznura (struny). Podstawmy teraz do tego równania odpowiednie pochodne funkcji

oraz

W wyniku podstawienia otrzymujemy

skąd możemy obliczyć prędkość fali

(15.4)

Zwróćmy uwagę, że sinusoidalna fala może być przenoszona wzdłuż struny z prędkością niezależną od amplitudy i częstotliwości.

Jeżeli teraz przepiszemy równanie struny w postaci

(15.5)

to otrzymamy równanie falowe, które stosuje się do wszystkich rodzajów rozchodzących się fal, takich jak fale dźwiękowe czy elektromagnetyczne.

Przenoszenie energii przez fale

Szybkość przenoszenia energii wyznaczymy obliczając siłę F jaka działa na koniec struny (porusza struną w górę i w dół w kierunku y).

W tym celu posłużymy się zależnością

Fyvy

Jak widać z rysunku prędkość poprzeczna równa jest vy = ∂y/∂t, a składowa siły F w kierunku y wynosi Fsinθ . Podstawiając do wzoru na moc otrzymujemy

Dla małych kątów θ możemy przyjąć sinθ ≅ – ∂y/∂x (znak minus wynika z ujemnego nachylenia struny). Stąd

Obliczamy teraz pochodne funkcji

i podstawiamy do wyrażenia na moc

(15.6)

Zauważmy, że moc czyli szybkość przepływu energii oscyluje w czasie. Korzystając z tego, że k = ω /v, ω = 2πf oraz, że otrzymujemy

(15.7)

Widzimy, że szybkość przepływu energii jest proporcjonalna do kwadratu amplitudy i kwadratu częstotliwości. Ta zależność jest prawdziwa dla wszystkich typów fal.

Interferencja fal

Rozważmy dwie fale o równych częstotliwościach i amplitudach ale o fazach różniących się o ϕ. Równania tych fal są następujące

y1 = Asin(kx – ωt – ϕ)

y2 = Asin(kx – ωt)

Znajdźmy teraz falę wypadkową (zasada superpozycji) jako sumę y = y1 + y2.

Korzystając ze wzoru na sumę sinusów otrzymujemy

y = 2Acos(ϕ/2)sin(kx – ωt – ϕ/2) (15.8)

co jest równaniem fali sinusoidalnej o amplitudzie 2Acos(ϕ/2). Dla ϕ = 0 fale spotykają się zgodnie w fazie (wzmacniają), a dla ϕ = 180 wygaszają.

Fale stojące

Rozważmy teraz dwa ciągi falowe biegnące w przeciwnych kierunkach tzn.

y1 = Asin(kx – ωt)

y2 = Asin(kx + ωt)

np. falę padającą i odbitą.

Falę wypadkową można zapisać jako

y = y1 + y2 = 2Asinkxcosωt (15.9)

To jest równanie fali stojącej. Zauważmy, że cząstki drgają ruchem harmonicznym prostym. Cząstki mają tę samą częstość ale różną amplitudę zależną od położenia cząstki x. Punkty kx = π/2, 3π/2, 5π/2, itd. czyli x = λ/4, 3λ/4, 5λ/4 itd. mające maksymalną amplitudę nazywamy strzałkami a punkty kx = π, 2π, 3π itd. czyli x = λ/2, λ, 3λ/2 itd. mające zerową amplitudę nazywamy węzłami.

Zwróćmy uwagę na jeszcze jedną istotną różnicę. Energia nie jest przenoszona wzdłuż sznura bo nie może ona przepłynąć przez węzły, jest na stałe zmagazynowana w poszczególnych elementach sznura.

Układy drgające, przykład

Jeżeli struna zamocowana na obu końcach zostanie najpierw wygięta a następnie puszczona, to wzdłuż struny rozchodzą się drgania poprzeczne. Zaburzenia te odbijają się od zamocowanych końców i w wyniku interferencji powstaje fala stojąca. Zwróćmy uwagę, że drgania struny wytwarzają w otaczającym strunę powietrzu dźwiękowe fale podłużne (fale akustyczne). Ponieważ jedynym warunkiem, jaki musi być spełniony, jest nieruchomość obu końców struny, czyli istnienie węzłów fali stojącej na tych końcach, to mogą powstać w tej strunie fale stojące o różnej długości. Pierwsze cztery rodzaje drgań jakie powstają w strunie o długości L zamocowanej na końcach są pokazane na rysunku poniżej. Takie fale stojące nazywamy rezonansami.

Widzimy, że długości fal spełniają związek

(15.10)

Korzystając z tego, że prędkość fali oraz podstawiając wyrażenie (15.4) możemy obliczyć częstotliwość rezonansów

(15.11)

Najniższą częstość nazywamy częstością podstawową a pozostałe wyższymi harmonicznymi czyli alikwotami.

Zazwyczaj w drganiach występują, oprócz drgania podstawowego, również drgania harmoniczne, a dźwięki jakie odbieramy są wynikiem nakładania się tych drgań. O jakości instrumentu (jego barwie) decyduje właśnie to ile alikwotów jest zawarte w dźwięku i jakie są ich natężenia. Przykładowo, drganie wypadkowe struny będące złożeniem tonu podstawowego (n = 1) i wyższych harmonicznych (n = 3, 5, 7) o różnych amplitudach jest pokazane na rysunku poniżej.

Zwróćmy uwagę, że wypadkowe drganie (chociaż okresowe) nie jest harmoniczne (nie daje się opisać funkcją sinus lub cosinus).

Dudnienia ‑ modulacja amplitudy

Mówiliśmy już o superpozycji fal, interferencji w przestrzeni (dodawanie fal o tej samej częstości). Rozpatrzmy teraz przypadek interferencji w czasie. Pojawia się ona gdy przez dany punkt w przestrzeni przebiegają w tym samym kierunku fale o trochę różnych częstotliwościach. Wychylenie wywołane przez jedną falę ma postać

y1 = Acos2πv1t

y2 = Acos2πv2t

więc

y = y1 + y2 = A(cos2πv1t + cos2πv2t)

Ze wzoru na sumę cosinusów

(15.12)

Drgania wypadkowe można więc uważać za drgania o częstości

vsrednie = (v1 + v2)/2

która jest średnią dwóch fal, i o amplitudzie (wyrażenie w nawiasie kwadratowym) zmieniającej się w czasie z częstością

vamp = (v1v2)/2

Jeżeli częstotliwości v1 i v2 są bliskie siebie to amplituda zmienia się powoli. Mówimy, że mamy do czynienia z modulacją amplitudy AM (stosowana np. w odbiornikach radiowych). Dla fal dźwiękowych AM przejawia się jako zmiana głośności nazywana dudnieniami (rysunek).

Zjawisko Dopplera

Austriak, Christian Doppler w pracy z 1842 r zwrócił uwagę, że barwa świecącego ciała (częstotliwość) musi się zmieniać z powodu ruchu względnego obserwatora lub źródła. Zjawisko Dopplera występuje dla wszystkich fal. Obecnie rozważymy je dla fal dźwiękowych. Zajmiemy się przypadkiem ruchu źródła i obserwatora wzdłuż łączącej ich prostej.

Źródło dźwięku spoczywa, a obserwator porusza się w kierunku źródła z prędkością vo. Nieruchomy obserwator odbierał by vt/λ fal w czasie t. Teraz odbiera jeszcze dodatkowo vot/λ fal. Częstość słyszana przez obserwatora

Ostatecznie

Studiując pozostałe przypadki otrzymujemy ogólną zależność

(15.12)

gdzie v' - częstość odbierana przez obserwatora, v - częstość źródła, v - prędkość fali, vo - prędkość obserwatora, vz - prędkość źródła.

Znaki "górne" w liczniku i mianowniku odpowiadają zbliżaniu się, a znaki dolne oddalaniu się obserwatora i źródła.

Wykład 16

Kinetyczna teoria gazów i termodynamika I

Prawo gazów doskonałych

Gaz doskonały:

  1. objętość cząsteczek gazu jest o wiele mniejsza niż objętość zajmowana przez gaz,

  2. zasięg sił działających między dwoma cząstkami jest o wiele mniejszy niż średnia odległość międzycząsteczkowa.

W wyprowadzeniu prawa gazów doskonałych będziemy traktować cząsteczki gazu jako N małych, twardych kulek zamkniętych w pudełku o objętości V. Kulki są twarde tzn. będą zderzały się sprężyście ze ściankami naczynia. Rozważmy jedną cząsteczkę, która zderza się z lewą ścianką naczynia (rysunek).

Średnia siła jaką cząsteczka wywiera na ściankę w czasie Δt wynosi

Zmiana pędu spowodowana zderzeniem ze ścianką wynosi

Δpx = mvx - ( - mvx) = 2mvx

Ponieważ czas pomiędzy kolejnymi zderzeniami z tą ścianką wynosi

Δt = 2l/vx

gdzie l jest odległością między ściankami, to

jest średnią siłą działającą na ściankę (na jedną cząstkę).

Dla N cząstek całkowita siła wynosi

gdzie jest to uśrednione po wszystkich cząsteczkach (średnia kwadratu). Dzieląc obie strony równania przez pole powierzchni ścianki S otrzymujemy ciśnienie

czyli

(16.1)

Jak widać iloczyn pV jest stały tak długo jak długo jest stała energia kinetyczna cząstek (prawo Boyle'a - Mariotta).

Zauważmy, że

Ponadto, ponieważ cząstki zderzają się w taki sam sposób ze wszystkimi sześcioma ściankami naczynia więc

więc

Teraz otrzymujemy równanie wyrażone przez v, a nie przez vx

(16.2)

Ponieważ Nm = M (masa gazu), oraz M/V = ρ więc równanie powyższe można przepisać w postaci

(16.3)

Temperatura

Zdefiniujmy temperaturę bezwzględną jako wielkość wprost proporcjonalną do średniej energii kinetycznej cząstek

(16.4)

gdzie k jest stałą Boltzmana k = 1.38·10-23 J/K.

Eliminując z równań (16.2) i (16.4) otrzymujemy

pV = NkT

lub

pV = nRT (16.5)

gdzie n jest liczbą moli (R = kNAV). Przypomnijmy, że stała Avogadra NAv = 6.023·1023 1/mol, określa liczbę cząsteczek w jednym molu.

Wyrażenie (16.5) przedstawia równanie stanu gazu doskonałego.

Równanie stanu gazu doskonałego zostało sformułowane w XIX w. przez Clapeyrona na podstawie trzech praw empirycznych odkrytych wcześniej przez innych badaczy:

Termometry

Aby zmierzyć temperaturę trzeba wyznaczyć energię kinetyczną cząsteczek gazu co jest bardzo trudne. Ale możemy się posłużyć równaniem stanu gazu doskonałego. Łatwo jest zmierzyć iloczyn pV np. dla układu o stałym ciśnieniu.

Ekwipartycja energii

Zerowa zasada termodynamiki

Jeżeli dwa ciała o różnych temperaturach zetkniemy ze sobą (i odizolujemy od innych) to po dostatecznie długim czasie ich temperatury wyrównają się. Powiemy, że te ciała są w równowadze termicznej ze sobą.

Jeżeli ciała 1 i 2 są w równowadze termicznej i ciała 2 i 3 są w równowadze termicznej to ciała 1 i 3 są w tej samej równowadze termicznej.

To jest zerowa zasada termodynamiki. Z zasad dynamiki Newtona można pokazać, że średnie energie kinetyczne ruchu postępowego (na cząsteczkę) dla dwu kontaktujących się gazów są równe.

Ekwipartycja energii

Wiemy już, że w równowadze termodynamicznej energie kinetyczne ruchu postępowego wszystkich cząsteczek są równe. Ale co z ruchem obrotowym i drganiami? Czy cząsteczka może gromadzić energię w innej postaci niż energia ruchu postępowego?

Jeżeli tylko cząstka nie ma kształtu kuli (1 atomowa) a ma pewną strukturę wewnętrzną to może wirować i drgać. Np. dwuatomowa w kształcie hantli zacznie się obracać po zderzeniu. Na podstawie mechaniki statystycznej można pokazać, że gdy liczba punktów materialnych jest bardzo duża i obowiązuje mechanika Newtonowska to dostępna energia rozkłada się w równych porcjach na wszystkie niezależne sposoby, w jakie cząsteczka może ją absorbować. Każdy z tych sposobów absorpcji energii nazywa się stopniem swobody i jest równy liczbie niezależnych współrzędnych potrzebnych do określenie położenia ciała w przestrzeni.

Innymi słowy: średnia energia kinetyczna na każdy stopień swobody jest taka sama dla wszystkich cząsteczek. Ten wynik nazywamy zasadą ekwipartycji energii.

Średnia energia kinetyczna ruchu postępowego (z równania definiującego T) wynosi

Odpowiada to trzem stopniom swobody (współrzędne x, y, z). Stąd średnia energia na stopień swobody wynosi (1/2)kT na cząsteczkę (zależy tylko od T).

Dla cząstek obracających się potrzeba 3 dodatkowych współrzędnych do opisania ruchu (obrót względem trzech osi) więc mamy dodatkowe 3 stopnie swobody.

O ile dla N cząsteczek nie obracających się całkowita energia (wewnętrzna) U będzie energią kinetyczną ruchu postępowego U = 3/2(NkT) to dla cząstek, które mogą obracać się swobodnie we wszystkich kierunkach (wieloatomowe)

U = (3/2)(NkT) + (3/2)(NkT) = 3NkT

Natomiast dla cząstki dwuatomowej (gładkiej)

U = 3/2(NkT) + (2/2)(NkT) = (5/2)(NkT)

bo nie ma obrotu wokół osi hantli.

Zwróćmy uwagę, że mówimy tu o energii "ukrytej" (wewnętrznej) cząstek a nie o energii makroskopowej (związanej z ruchem masy). O tej energii mówiliśmy przy zasadzie zachowania energii (energia indywidualnych cząstek nie zawarta w energii kinetycznej czy potencjalnej ciała jako całości). Energię wewnętrzną oznacza się zazwyczaj przez U i takie oznaczenie będziemy dalej stosować.

Pierwsza zasada termodynamiki

To jest po prostu inna wersja zasady zachowania energii, w której mamy rozdzieloną energię ciała na część makroskopową i mikroskopową. Makroskopowa to energia ruchu masy (energia mechaniczna). Mikroskopowa to "ukryta" energia cząstek (energia wewnętrzna).

Gdy dwa układy (ciała) o różnych temperaturach zetkniemy ze sobą to ciepło ΔQ przepływa z ciała cieplejszego do chłodniejszego. Zgodnie z zasadą zachowania energii, ciepło pobrane przez układ musi być równe wzrostowi energii wewnętrznej układu plus pracy wykonanej przez układ nad otoczeniem zewnętrznym czyli

ΔQ = ΔU + ΔW (16.6a)

To jest sformułowanie I zasady termodynamiki.

Zasada ta pracuje "w obie strony" tzn., gdy nad układem zostanie wykonana praca to układ może oddawać ciepło. To równanie bardzo często przybiera postać

dU = dQ – dW (16.6b)

Jeżeli rozpatrujemy układ jak na rysunku poniżej

dW = Fdl = (F/S)(Sdl) = pdV (16.7)

i wtedy

dU = dQpdV

Ciepło właściwe

Ciepło właściwe definiujemy jako dQ/dT na gram lub mol substancji (ciepło wagowe lub molowe).

Ciepło właściwe przy stałej objętości

Ponieważ dV = 0 więc dU = dQ a stąd

cv = dQ/dT = dU/dT

Dla gazu jednoatomowego (dla jednego mola) U = (3/2)NAVkT = (3/2)RT.

Zatem

cv = (3/2)R

Dla cząsteczki dwuatomowej spodziewamy się więc

cv = (5/2)R

a dla wieloatomowej

cv = 3R

Niedoskonałością modelu opartego na mechanice klasycznej jest to, że przewiduje ciepło właściwe niezależne od temperatury, a badania pokazują, że jest to prawdziwe tylko dla gazów jednoatomowych. Dla pozostałych cv rośnie z temperaturą.

Na rysunku poniżej przedstawiono cV dla wodoru (H2) w funkcji temperatury (w skali logarytmicznej).

W temperaturach niższych od 100 K, cv = (3/2)R co wskazuje, że w tak niskich temperaturach nie ma rotacyjnych stopni swobody. Rotacja staje się możliwa dopiero w temperaturach wyższych (cv = (5/2)R). Ale w temperaturach powyżej 2000 K, cv osiąga wartość (7/2)R.

Wytłumaczenie tych zjawisk nie jest możliwe na gruncie mechaniki klasycznej. Dopiero mechanika kwantowa daje wyjaśnienie tych zmian. Gdyby cząstka miała moment pędu to musiał by on być równy co najmniej Lmin = h/2π ≈ 10-34 kg m2 s-1 (analogia do modelu Bohra atomu wodoru). Energia kinetyczna ruchu obrotowego dana jest wyrażeniem

Dla cząsteczki H2 m=1.67·10-27 kg, a R ≈ 5·10-11 m, więc I = 2mR2 ≈ 8.3·10-48 kg m2.

Ponieważ na jeden stopień swobody przypada energia kT/2 więc

kT/2 = L2/2I

czyli

T = L2/kI

Stąd dla Lmin otrzymujemy Tmin ≈ 90 K.

Dla niższych temperatur energia jest za mała aby wzbudzić rotacje co wymaga pewnej minimalnej energii. Podobnie jest dla ruchu drgającego, który także jest skwantowany.

Edrg,min = hv. Dla typowej cząsteczkowej częstotliwości drgań 1014 Hz (zakres widzialny) otrzymujemy energię drgań ≈ 6·10-20 J co odpowiada temperaturze około 4000 K. Tak więc z zasady ekwipartycji energii wynika, że w tak wysokich temperaturach średnia energia drgań Edrg = kT/2. Oprócz energii kinetycznej tego ruchu istnieje jeszcze jego energia potencjalna. Zatem średnia energia wewnętrzna na cząsteczkę wynosi

U = Eśr,kin,post + Eśr,kin,rot + Eśr,kin,drg + Eśr,pot,drg

U = (3/2)kT + (2/2)kT + (1/2)kT + (1/2)kT = (7/2)kT

Dla 1 mola

U = (7/2)RT więc cv = (7/2)R

Ciepło właściwe przy stałym ciśnieniu

Z I zasady termodynamiki mamy

dQ = dU + pdV

Ponieważ U zależy tylko od T więc mamy dU = cvdT więc

dQ = cvdT + pdV

Dla gazu doskonałego (1 mola) dV = RdT/p, więc

dQ = cvdT + RdT

skąd

dQ/dT = cv + R

Ostatecznie więc

cp = cv + R

Molowe ciepła właściwe różnych rodzajów gazów doskonałych (teoretyczne) są zestawione w tabeli poniżej.

Typ gazu cv cp cp/cv

Jednoatomowy

Dwuatomowy + rotacja

Dwuatomowy + rotacja + drgania

Wieloatomowy + rotacja (bez drgań)

(3/2)R

(5/2)R

(7/2)R

(6/2)R

(5/2)R

(7/2)R

(9/2)R

(8/2)R

5/3

7/5

9/7

4/3

Rozprężanie izotermiczne

Działanie silnika opiera się o rozprężanie zapalonej mieszanki gazowej.

Zwykle dwa przypadki

  1. rozprężanie izotermiczne

  2. rozprężanie adiabatyczne

Przy rozprężaniu izotermicznym trzeba utrzymywać stałą temperaturę ścian cylindra, czyli tłok musi poruszać się wolno, żeby gaz mógł pozostawać w równowadze termicznej ze ściankami cylindra.

Ponieważ T = const. więc dU = 0, a stąd dQ = dW

(16.8)

Rozprężanie adiabatyczne

Zwykle w silnikach tłok porusza się bardzo szybko więc nie ma dość czasu na przepływ ciepła pomiędzy gazem, a ścianami cylindra. Wtedy dQ = 0 i otrzymujemy

dU + pdV = 0

Możemy to przepisać w postaci

cvdT + pdV = 0

na 1 mol.

Z równania stanu gazu doskonałego otrzymujemy różniczkując

pdV + Vdp = RdT

Stąd obliczmy dT i wstawiamy do poprzedniego równania

Zastępujemy teraz cv + R = cp i otrzymujemy

gdzie γ = cp/cv.

Całkując to równanie otrzymamy

gdzie const. oznacza stałą całkowania.

Mamy więc

ln(pVγ) = const.

czyli

pVγ = const. (16.9)

co można zapisać:

p1V1γ = p2V2γ

Przykład 1

Silnik benzynowy ma stopień sprężu 9 tzn. V2/V1 = 9. Jaki jest stosunek temperatury gazów wydechowych do temperatury spalania?

p1V1γ = p2V2γ więc p2/p1 = (V1γ/V2γ)

Dla gazu doskonałego

p2/p1 = (V1T2)/(V2T1)

Porównują te równania otrzymujemy

T2/T1 = (V1/V2)γ-1

Powietrze jest głównie dwuatomowe więc γ = 1.4. Stąd otrzymujemy T2/T1 = 0.415

Wykład 17

Kinetyczna teoria gazów i termodynamika II

Średnia droga swobodna

Średnia droga swobodna to inaczej średnia odległość między miejscami kolejnych zderzeń. Zależy od rozmiarów cząsteczek i od ich liczby w jednostce objętości.

Rozpatrujemy cząstkę kulistą o średnicy d. Zderzenie będzie miało miejsce gdy odległość między środkami będzie mniejsza niż d. Inaczej mówiąc cząsteczka jest "tarczą" o powierzchni

σ = πd2

Ta powierzchnia nosi nazwę całkowitego przekroju czynnego.

W czasie t cząsteczka poruszająca się z prędkością v "przemiata" objętość walca vtσ. Jeżeli n jest liczbą cząsteczek w jednostce objętości to w tym walcu nasza cząstka napotka (zderzy się z)

nz = vtσn

cząstek.

Średnia droga swobodna to średnia odległość pomiędzy punktami kolejnych zderzeń. Jest ona równa całkowitej odległości przebywanej przez cząstkę podzielonej przez liczbę zderzeń

(17.1)

To równanie wyprowadzono w oparciu o założenie, że cząstka zderza się z nieruchomymi obiektami. W rzeczywistości cząsteczki uderzają w poruszający się cel. Częstość zderzeń jest większa, a średnia droga swobodna mniejsza

(17.2)

Zwróćmy uwagę, że wtedy w równaniu (17.1) dwie występujące tam prędkości są różne: prędkość w liczniku to prędkość średnia cząsteczek względem naczynia, a prędkość w mianowniku to średnia prędkość względna w stosunku do innych cząsteczek. Można się przekonać jakościowo, że

>

Np. gdy cząstki biegną naprzeciw siebie to = 2, gdy pod kątem prostym to , a gdy w tę samą stronę to = 0. Uwzględniając rzeczywisty rozkład prędkości otrzymujemy .

Przykład 1

Cząstki powietrza w temperaturze 273 K i pod ciśnieniem 1 atm.

d = 2·10-8 cm, = 105 cm/s, n = 3·1019/cm3.

Wówczas średnia droga swobodna jest równa 2·10-5 cm (około 1000d).

Odpowiednia częstość zderzeń wynosi 5·109/s.

Rozkład prędkości Maxwella

Na poprzednim wykładzie omawialiśmy prędkość średnią kwadratową cząsteczek gazu. Jednak każdy gaz ma charakterystyczny rozkład prędkości, który zależy od temperatury (cząstki nie mogą mieć takich samych prędkości bo prędkości zmieniają się w wyniku zderzeń).

Clerk Maxwell podał prawo rozkładu prędkości cząsteczek, które dla gazu zawierającego N cząsteczek ma postać

(17.3)

W równaniu tym N(v)dv jest liczbą cząstek o prędkościach z przedziału od v do v + dv. T - temperatura bezwzględna, k - stała Boltzmana, m - masa cząsteczki.

Całkowitą liczbę cząsteczek można zatem obliczyć dodając (całkując) liczby dla poszczególnych różniczkowych przedziałów prędkości

Na rysunku przedstawiony jest rozkład Maxwella dla dwóch różnych temperatur.

gdzie - prędkość średnia, - prędkość średnia kwadratowa, vp – prędkość najbardziej prawdopodobna.

Krzywa nie jest symetryczna bo dolny limit równy jest zeru podczas gdy górny nieskończoności. Ze wzrostem temperatury rośnie prędkość średnia kwadratowa. Obszar prędkości jest teraz większy. Ponieważ liczba cząstek (pole pod krzywą) jest stała więc rozkład się "rozpłaszcza". Wzrost, wraz z temperaturą, liczby cząstek o prędkościach większych od danej tłumaczy wiele zjawisk takich jak np. wzrost szybkości reakcji chemicznych towarzyszących zwiększeniu temperatury. Z równania widać, że rozkład prędkości zależy od masy cząsteczek. Im mniejsza masa tym więcej szybkich cząsteczek (w danej temperaturze). Dlatego wodór łatwiej ucieka z górnych warstw atmosfery niż tlen czy azot.

Równanie Van der Waalsa

Równanie stanu gazu doskonałego

pV = nRT

dobrze opisuje gazy rzeczywiste ale przy małych gęstościach. Przy większych gęstościach nie można pominąć faktu, że cząstki zajmują część objętości dostępnej dla gazu oraz że zasięg sił międzycząsteczkowych może być większy niż odległości międzycząsteczkowe.

J.D. Van der Waals wprowadził zmienione równanie stanu gazu, które uwzględnia te czynniki. Jeżeli cząstki posiadają skończoną objętość to rzeczywista objętość dostępna dla cząstek jest mniejsza od objętości naczynia. "Objętość swobodna" jest mniejsza od objętości naczynia o "objętość własną" cząsteczek b. Jeżeli oznaczymy przez v objętość przypadającą na jeden mol v = V/n to otrzymamy zmodyfikowane równanie stanu gazu

p(v – b) = RT

Można również prosto uwzględnić efekt sił międzycząsteczkowych. Siły przyciągania pomiędzy n cząsteczkami (na jednostkę objętości) "po lewej" z n cząsteczkami (na jednostkę objętości) "po prawej" jest proporcjonalna do n2 czyli proporcjonalna do 1/v2. Siła przyciągająca znajduje swoje odzwierciedlenie w dodatkowym ciśnieniu, które zostało uwzględnione w równaniu Van der Waalsa

(17.4)

gdzie stałe a i b wyznaczamy doświadczalnie. (Równanie Van der Waalsa też bywa zawodne ale nie jest znana prosta formuła, która stosowałaby się do różnych gazów w różnych warunkach).

Na rysunku poniżej porównano zachowanie się gazu doskonałego (rysunek po lewej) w stałej temperaturze z gazem Van der Waalsa (po prawej).

Entropia i druga zasada termodynamiki

Procesy odwracalne i nieodwracalne

Rozpatrzmy dwa przypadki izotermicznego sprężanie gazu.

  1. Tłok przesuwamy bardzo szybko i czekamy aż ustali się równowaga z otoczeniem. W czasie takiego procesu ciśnienie i temperatura gazu nie są dobrze określone bo nie są jednakowe w całej objętości.

  2. Tłok przesuwamy bardzo powoli, tak że ciśnienie i temperatura gazu są w każdej chwili dobrze określone. Ponieważ zmiana jest niewielka to gaz szybko osiąga nowy stan równowagi. Możemy złożyć cały proces z ciągu takich małych przesunięć tłoka i wtedy podczas całego procesu gaz jest bardzo blisko równowagi. Jeżeli będziemy zmniejszać nasze zmiany to w granicy dojdziemy do procesu idealnego, w którym wszystkie stany pośrednie (pomiędzy początkowym i końcowym) są stanami równowagi.

Proces typu (1) nazywamy procesem nieodwracalnym a proces typu (2) procesem odwracalnym.

Proces nazywamy odwracalnym gdy za pomocą bardzo małej (różniczkowej) zmiany otoczenia można wywołać proces odwrotny do niego tzn. przebiegający po tej samej drodze w przeciwnym kierunku.

Cykl Carnota

Bardzo ważnym cyklem odwracalnym jest cykl Carnota. Cykl ten wyznacza granicę naszych możliwości zamiany ciepła na pracę.

  1. Gaz znajduje się w stanie p1, V1, T1 (punkt A). Cylinder stawiamy na zbiorniku ciepła i pozwalamy, żeby gaz rozprężył się izotermicznie do stanu p2, V2, T1 (punkt B). Gaz pobiera ciepło Q1.

  2. Cylinder stawiamy na izolującej podstawce i pozwalamy na dalsze rozprężanie adiabatyczne gazu (np. zmniejszając obciążenie tłoka) do stanu p3, V3, T2 (punkt C). Gaz wykonuje pracę przy podnoszeniu tłoka i jego temperatura spada do T2.

  3. Cylinder stawiamy na (zimniejszym) zbiorniku (T2) i sprężamy gaz izotermicznie do stanu p4, V4, T2 (punkt D). Z gazu do zbiornika przechodzi ciepło Q2.

  4. Cylinder stawiamy na izolującej podstawce i sprężamy adiabatycznie do stanu p1, V1, T1 (punkt A). Siły zewnętrzne wykonują pracę i temperatura gazu podnosi się do T1.

Wypadkowa praca W wykonana przez układ w czasie pełnego cyklu jest opisana przez powierzchnię zawartą wewnątrz krzywej 1,2,3,4. Wypadkowa ilość ciepła pobrana przez układ podczas jednego cyklu wynosi Q1 - Q2. Wypadkowa zmiana energii wewnętrznej wynosi zero bo stan końcowy pokrywa się z początkowym. Z pierwszej zasady termodynamiki mamy więc

W = Q1Q2

Sprawność silnika wynosi

(17.5)

Cykl Carnota można prowadzić w kierunku przeciwnym (maszyna chłodząca).

Druga zasada termodynamiki

Zwróćmy jeszcze raz uwagę na to, że w trakcie pracy (cyklu) silnika cieplnego część pobieranego ciepła była oddawana do zbiornika o niższej temperaturze i w konsekwencji ta ilość ciepła nie była zamieniana na pracę. Powstaje pytanie, czy można skonstruować urządzenie, które pobierałoby ciepło i w całości zamieniałoby je na pracę? Moglibyśmy wtedy wykorzystać ogromne (z naszego punktu widzenia nieskończone) ilości ciepła zgromadzone w oceanach, które byłyby stale uzupełniane poprzez promieniowanie słoneczne.

Negatywna, niestety, odpowiedź na to pytanie jest zawarta w drugiej zasadzie termodynamiki. Poniżej podane zostały równoważne sformułowania tej zasady

  1. Nie można zbudować perpetum mobile drugiego rodzaju.

  2. Gdy dwa ciała o różnych temperaturach znajdą się w kontakcie termicznym, wówczas ciepło będzie przepływało z cieplejszego do chłodniejszego.

  3. Żadna cykliczna maszyna cieplna pracująca pomiędzy temperaturami T1 i T2 nie może mieć sprawności większej niż (T1 ‑ T2)/T1.

  4. W układzie zamkniętym entropia nie może maleć.

Rozpatrzmy następujący schemat (pokazany na rysunku poniżej),w którym super silnik o sprawności większej od silnika Carnota napędza ten silnik. Efektem końcowym jest przeniesienie dwóch jednostek ciepła z zimniejszego do cieplejszego zbiornika.

Termodynamiczna skala temperatur

Pokazaliśmy więc, że sprawność silnika Carnota jest równa

Wynika stąd, że

T1/T2 = Q1/Q2

Zatem stosunek temperatur dowolnych zbiorników ciepła można wyznaczyć mierząc przenoszenie ciepła podczas jednego cyklu Carnota. Powyższy wzór stanowi definicję termodynamicznej skali temperatur.

Entropia

  1. Druga zasada termodynamiki wiąże się z pojęciem entropii

Entropia jest miarą nieuporządkowania układu cząstek. Im większy jest stan nieporządku położeń i prędkości w układzie tym większe prawdopodobieństwo, że układ będzie w tym stanie.

Przykłady sytuacji gdy nieuporządkowanie rośnie bo tracimy część zdolności do klasyfikacji cząstek.

  1. Rozprężanie swobodne

  2. Przepływ ciepła do wyrównania temperatur

Z definicji entropia S układu jest równa

S = klnω (17.6)

gdzie k - stała Boltzmana, ω - prawdopodobieństwo, że układ jest w danym stanie (w odniesieniu do wszystkich pozostałych stanów).

Zgodnie z definicją prawdopodobieństwa układ częściej będzie w stanie o większym prawdopodobieństwie niż w stanie o mniejszym prawdopodobieństwie. Układ więc "poszukuje" stanów o większym prawdopodobieństwie, a w miarę wzrostu ω rośnie również S. Stąd

ΔS ≥ 0

To jest czwarte sformułowanie drugiej zasady termodynamiki. Pokażmy, że pozostałe sformułowania są mu równoważne.

ΔS = S2S1 = klnω2klnω1

ΔS = kln(ω2/ω1)

Rozpatrzmy teraz swobodne rozprężanie gazu od objętości V1 do objętości końcowej V2.

Względne prawdopodobieństwo znalezienia jednej cząstki w V1 w porównaniu do V2 jest

Dla N cząstek stosunek prawdopodobieństw

Otrzymujemy więc

ΔS =Nkln(V2/V1)

Podzielmy i pomóżmy równanie przez T; otrzymamy wtedy

Wyrażenie w liczniku jest równe ilości ciepła ΔQ dostarczonego do układu aby ten przeszedł do stanu końcowego w sposób odwracalny (rozprężanie izotermiczne).

(17.7)

więc ostatecznie

(17.8)

gdzie dQ jest ciepłem dostarczanym do układu w procesie odwracalnym.

Entropia S jest termodynamiczną funkcją zależną tylko od początkowego i końcowego stanu układu, a nie od drogi przejścia pomiędzy tymi stanami (termodynamiczna definicja entropii).

Z tego punktu widzenia szczególnie interesujące są procesy adiabatyczne nie związane z przepływem ciepła pomiędzy układem i otoczeniem. W procesie adiabatycznym dQ = 0, więc dla procesu odwracalnego dS = 0 na podstawie równania (17.8).

Oznacza to, że entropia układu izolowanego adiabatycznie, w którym zachodzą procesy odwracalne, jest stała. Jednocześnie można pokazać, że dla procesu adiabatycznego nieodwracalnego, entropia układu rośnie.

Można uogólnić zasadę wzrostu entropii na układy nieizolowane adiabatycznie tzn. takie, które wymieniają ciepło z otoczeniem. Traktujemy wtedy nasz układ i otoczenie razem jako jeden "większy" układ ponownie izolowany adiabatycznie. Wtedy

gdzie dSo jest zmianą entropii otoczenia. Zmienia się więc entropia naszego układu i otoczenia. Jeżeli proces jest odwracalny to podczas przenoszenia ciepła dQ z otoczenia do naszego układu entropia otoczenia maleje o dQ/T, a entropia układu rośnie o tę samą wartość dQ/T, więc całkowita zmiana entropii jest równa zeru.

Zatem posługując się entropią (zgodnie z drugą zasadą termodynamiki) możemy stwierdzić czy dany proces może zachodzić w przyrodzie.

Przykład

Stosując wzór (17.8) można pokazać, np. że ciepło przepływa z ciała gorącego do zimnego, a nie odwrotnie. Dwa identyczne ciała o T1 i T2 kontaktujemy termicznie. Po chwili temperatury wynoszą odpowiednio T1 - dT1, T2 + dT2 wskutek przepływu ciepła:

dQ1 = -mcdT1 i dQ2 = mcdT2

Ponieważ dQ1 = – dQ2 więc dT1 = – dT2 = dT

Zmiana entropii każdego z ciał jest równa

dS1 = – mcdT/T1 i dS2 = mcdT/T2

Wypadkowa zmiana entropii wynosi

dS = mcdT(1/T2 – 1/T1)

skąd zmiana temperatury

dS jest dodatnia więc dT ma taki sam znak jak (T1T2). Tak więc jeżeli T1 > T2 to ciepło przepływa z ciała o T1 do ciała o T2.

Przypuśćmy, że ten strumień ciepła dQ1 został użyty do napędzania silnika Carnota pracującego pomiędzy T1 i T2. Wówczas zgodnie z wyrażeniem na sprawność

można uzyskać pracę mechaniczną

Można pokazać całkiem ogólnie, że jeżeli w układzie zamkniętym zawierającym ciała o różnych temperaturach następuje wzrost entropii dS to towarzyszy temu strata energii mechanicznej dW równa iloczynowi dS i temperatury najchłodniejszego ciała.

Uwaga: możliwe jest lokalne zmniejszenie entropii, kiedy jednak bierze się pod uwagę wszystkie części układu (układ zamknięty) to wypadkowa zmiana entropii będzie równa zeru lub będzie dodatnia.

Stan równowagi, zjawiska transportu

Stan równowagi

Stan równowagi układu to taki stan, w którym żaden z parametrów potrzebnych do makroskopowego opisu układu nie zależy od czasu. Dla układu jednorodnego (np. gazu) w stanie równowagi wystarcza znajomość dwu podstawowych parametrów stanu np. ciśnienie i objętość.

Opis komplikuje się gdy mamy układ niejednorodny np. ciecz w równowadze z parą. Dla danej temperatury stan równowagi tego układu jest możliwy przy różnych objętościach układu (od objętości zależy ilość fazy ciekłej i gazowej). Natomiast temperatura i ciśnienie przestają być niezależne. W każdej temperaturze równowaga jest możliwa tylko przy określonym ciśnieniu (pary nasyconej). Przy wyższym istnieje tylko ciecz, przy niższym para. Podobnie ciecz i ciało stałe mogą istnieć w równowadze tylko w temperaturze topnienia, która jest funkcją ciśnienia. Wreszcie ciało stałe współistnieje w równowadze z parą nasyconą, której ciśnienie jest funkcją temperatury. Krzywe równowagi pokazane na rysunku poniżej.

Literą a oznaczona jest krzywa równowagi ciało stałe ‑ ciecz (związek temperatury topnienia z ciśnieniem). Krzywa a' przedstawia tę zależność dla kilku nietypowych substancji, które przy topnieniu zmniejszają objętość np. lód.

Krzywa b + b' pokazuje zależność ciśnienia pary nasyconej od temperatury. Punkt P nazywamy punktem potrójnym. Odcinek b' to krzywa równowagi ciało stałe – para, a odcinek b krzywa równowagi ciecz – para. W punkcie potrójnym mogą istnieć wszystkie trzy stany skupienia. Dla wody odpowiada to ciśnieniu p = 4.57 mm Hg, T = 273.16 K (O °C). Krzywa b kończy się w punkcie krytycznym K powyżej którego nie istnieje różnica pomiędzy gazem i cieczą. Dlatego żeby skroplić gaz trzeba obniżyć temperaturę poniżej temperatury krytycznej.

Zjawiska transportu

Dotychczas zajmowaliśmy się właśnie układami w stanie równowagi. Teraz zapoznamy się z bardzo uproszczonym opisem zjawisk, które zachodzą gdy układ dąży do takiego stanu. W zjawiskach tych mamy zawsze do czynienia z przenoszeniem (transportem):

  1. materii

  2. energii

  3. pędu

  4. ładunku elektrycznego

Wszystkie te zjawiska transportu opisujemy w pierwszym przybliżeniu za pomocą równania różniczkowego, które przedstawia propagację pewnej wielkości fizycznej ϕ mającą na celu osiągnięcie równowagi

(17.8)

gdzie j jest gęstością strumienia wielkości ϕ (gęstość prądu), K jest stałą charakteryzującą daną sytuację fizyczną. Stałą K wiążemy z właściwościami mikroskopowymi rozpatrywanego układu statystycznego, z tzw. współczynnikami transportu. Wiążą się one z nośnikami np. cząsteczkami gazu, elektronami w metalu.

  1. Dyfuzja w gazie czyli przenoszenie cząstek w kierunku obszarów o mniejszej koncentracji n (dążenie do wyrównania koncentracji). Równanie dyfuzji

gdzie jD gęstość strumienia cząstek, n - koncentracja cząstek. Równanie to znane jest pod nazwą prawa Ficka.

Współczynnik dyfuzji (dla rozrzedzonego gazu)

  1. Przewodnictwo cieplne czyli transport energii, wskutek ruchu cząstek w kierunku obszaru o niższej T (dążenie do wyrównania temperatury).

Równanie (prawo Fouriera) ma postać

gdzie jQ jest gęstością strumienia ciepła, κ jest współczynnikiem przewodnictwa cieplnego. Dla rozrzedzonego gazu

  1. Lepkość gazu polegająca na przenoszeniu pędu między warstwami gazu o różnych prędkościach (dążenie do wyrównania prędkości).

Równanie (prawo Newtona) ma postać

gdzie u jest prędkością (unoszenia) warstwy. Współczynnik lepkości dla rozrzedzonego gazu wynosi

  1. Przewodnictwo elektryczne czyli przenoszenie ładunku elektrycznego w wyniku ruchu elektronów (dążenie do wyrównania potencjałów elektrycznych). Równanie (prawo Ohma) ma postać

gdzie przewodność elektryczna σ jest dana wyrażeniem

Uwaga: wszystkie współczynniki transportu zależą od temperatury (poprzez prędkość średnią, średnią drogę swobodną itd.)

Wykład 18

Siła elektrostatyczna

Wstęp

Oddziaływanie elektromagnetyczne - chyba najważniejsze w fizyce. Pozwala wyjaśnić nie tylko zjawiska elektryczne ale też siły zespalające materię na poziomie atomów, cząsteczek. Przewodniki i izolatory. Doświadczenie z naładowaniem pręta metalowego i pręta szklanego. Zdolność izolacyjna stopionego kwarcu jest 1025 razy większa niż miedzi.

Ładunek elektryczny

Porównajmy siłę grawitacyjną pomiędzy elektronem i protonem w atomie wodoru F = 3.61·10-47 N z siła elektryczną pomiędzy nimi w tym samym atomie F = 2.27·10-8 N.

To, że siły grawitacyjne dla "dużych" ciał dominują wynika stąd, że liczby protonów i elektronów są równe.

Nie istnieje, żaden związek między masą i ładunkiem.

W przeciwieństwie do masy ładunki "+" lub "-".

Kwantyzacja ładunku

Ładunek elementarny e = 1.6·10-19 C. Wszystkie ładunki są wielokrotnością e.

Zachowanie ładunku

Zasada zachowania ładunku - B. Franklin. Wypadkowy ładunek w układzie zamkniętym jest stały.

Prawo Coulomba

Siła oddziaływania dwóch ładunków q1 i q2

(18.1)

gdzie stała . Współczynnik ε0 = 8.854·10-12 C2/(Nm2) nosi nazwę przenikalności elektrycznej próżni. W układzie cgs k = 1.

Zasada superpozycji

Siłę wypadkową (tak jak w grawitacji) obliczamy dodając wektorowo siły dwuciałowe.

Przykład 1

Dipol elektryczny składa się z dwóch ładunków oddalonych od siebie l. Jaka siła jest wywierana na ładunek q umieszczony tak jak na rysunku?

Z podobieństwa trójkątów

Stąd

gdzie p = Ql jest momentem dipolowym.

Pole elektryczne

W wykładzie 6 zdefiniowaliśmy natężenie pola grawitacyjnego w dowolnym punkcie przestrzeni jako siłę grawitacyjną działająca na masę m umieszczoną w tym punkcie przestrzeni podzieloną przez tę masę.

Analogicznie definiujemy natężenie pola elektrycznego jako siłę działającą na ładunek próbny q (umieszczony w danym punkcie przestrzeni) podzieloną przez ten ładunek.

Aby zmierzyć natężenie pola elektrycznego E w dowolnym punkcie P, należy w tym punkcie umieścić ładunek próbny i zmierzyć wypadkową siłę elektryczną F działającą na ten ładunek. Należy upewnić się czy obecność ładunku q nie zmienia położeń innych ładunków. Wtedy

(18.2)

Ładunek próbny jest dodatni (umowa). Kierunek E jest taki sam jak F (na ładunek dodatni).

Przykład 2

Ten sam układ co poprzednio tylko w punkcie P nie ma "jakiegoś" ładunku tylko tam umieścimy ładunek próbny. Korzystając z otrzymanej zależności obliczamy E

Pole E w punkcie P jest skierowane w prawo.

Pole E w odległości r od ładunku punktowego Q jest równe

Pole elektryczne od n ładunków punktowych jest równe sumie wektorowej pól elektrycznych

Przykład 3

Całkowity ładunek naładowanego pierścienia o promieniu R wynosi Q. Jakie jest pole elektryczne na osi pierścienia w odległości x0 od środka?

Pole wytwarzane przez element dl pierścienia jest równe

dEx = dE(cosα)

cosα = x0/r

Jeżeli λ = Q/2πR jest liniową gęstością ładunku to

oraz

Stąd

Zwróćmy uwagę, że w środku pierścienia (x0 = 0) E = 0, a dla x0 >> R pole EkQ/x02 i jest takie samo jak pole ładunku punktowego w tej odległości.

Jedną z zalet posługiwania się pojęciem pola elektrycznego jest to, że nie musimy zajmować się szczegółami źródła pola. Np. pole E = kQ/r2 może pochodzić od wielu źródeł.

Linie sił

Kierunek pola E w przestrzeni można przedstawić za pomocą tzw. linii sił. Linie nie tylko pokazują kierunek E ale też jego wartość (liczba linii na jednostkę powierzchni).

Jeżeli liczbę linii przechodzących przez powierzchnię ΔS oznaczymy Δφ to wówczas

Δφ = E ΔS = EΔS cosα

gdzie α jest kątem pomiędzy wektorem powierzchni ΔS i wektorem E.

W ogólności więc

dφ = dE ds (18.3)

i jest to definicja strumienia elektrycznego.

Całkowity strumień przechodzący przez powierzchnię S można obliczyć jako sumę przyczynków od elementów powierzchni

Suma ta przedstawia całkę powierzchniową

(18.4)

Obliczmy teraz strumień dla ładunku punktowego w odległości r od niego.

W tym celu rysujemy kulę o promieniu r wokół ładunku Q i liczymy strumień (liczbę linii przez powierzchnię).

(18.5)

Otrzymany strumień nie zależy od r, a zatem strumień jest jednakowy dla wszystkich r. Całkowita liczba linii wychodzących od ładunku jest równa Q/ε0 i linie te ciągną się do nieskończoności.

Ponieważ pokazaliśmy, że strumień jest taki sam przez każdą powierzchnię niezależnie od r więc jest to prawdą dla zamkniętej powierzchni o dowolnym kształcie (która otacza ładunek Q).

Taka powierzchnia nazywa się powierzchnią Gaussa.

Prawo Gaussa.

Niech zamknięta powierzchnia obejmuje dwa ładunki Q1 i Q2. Całkowita liczba linii sił przecinająca powierzchnię zamkniętą wokół ładunków Q1 i Q2 jest równa

gdzie E1 jest wytwarzane przez Q1, a E2 przez Q2. Powołując się na wcześniejszy wynik otrzymujemy

φcałk = (Q1/ε0) + (Q2/ε0) = (Q1 + Q2)/ε0

Całkowita liczba linii sił jest równa całkowitemu ładunkowi podzielonemu przez ε0. Podobnie można pokazać dla dowolnej liczby n ładunków.

Otrzymujemy więc prawo Gaussa

(18.6)

Strumień pola wychodzący z naładowanego ciała jest równa wypadkowemu ładunkowi podzielonemu przez ε0. Jeżeli Q jest ujemne strumień wpływa do ciała.

Linie mogą zaczynać się i kończyć tylko na ładunkach a wszędzie indziej są ciągłe.

A co w sytuacji gdy na zewnątrz zamkniętej powierzchni są ładunki?

Rozważmy zamkniętą powierzchnię (rysunek) wewnątrz której Qwewn. = 0, a linie sił pochodzą od ładunku na zewnątrz.

Całkowity strumień dzielimy na części

φcałk = φab + φbc + φcd + φda

Z rysunku widać, że φab = +2, φbc = +3, φcd = -7, φda = +2. Tak więc

φcałk = +2 + 3 - 7 + 2 = 0

Na następnym wykładzie zastosujemy prawo Gaussa do obliczania E dla różnych naładowanych ciał.

Wykład 19

Elektrostatyka I

Wstęp

Większość ciał stałych można podzielić na przewodniki i izolatory. W izolatorze nadmiarowy ładunek może być rozmieszczony w całej objętości natomiast w przewodnikach swobodne elektrony będą się zbierały na powierzchni dopóty, dopóki nie wytworzy się pole równoważące pole zewnętrzne.

Rozpatrzmy dowolny w kształcie przewodnik. Wybierzmy powierzchnię zamkniętą tuż poniżej powierzchni przewodnika.

Zastosujmy prawo Gaussa do tej powierzchni

Wewnątrz przewodnika w dowolnym punkcie powierzchni S pole musi być równe zeru, bo inaczej elektrony poruszałyby się czyli

Zatem

0 = Qwewn./ε0

Stąd

Qwewn. = 0

Tak więc ładunek wewnątrz dowolnej zamkniętej powierzchni (przewodnika) musi być równy zeru; cały ładunek gromadzi się na powierzchni.

Kuliste rozkłady ładunków

Jednorodnie naładowana sfera

Rozpatrzmy jednorodnie naładowaną powierzchnię kulistą.

W dowolnym punkcie sfery E  S (prostopadłe do powierzchni) więc

Zgodnie z prawem Gaussa:

E(4πr2) = Q/ε0

czyli

(19.1)

dla r > R (tak jakby cały ładunek skupiony był w środku sfery).

Dla r < R, E = 0.

Jednorodnie naładowana kula

Przewodniki - równoważne sferze bo ładunek na powierzchni.

Izolator - równoważny szeregowi współśrodkowych sfer.

gdzie Qwewn. = Q(r3/R3) (stosunek objętości kuli o promieniu r do objętości kuli o promieniu R, rysunek).

Czyli

(19.2)

Wykres E w funkcji odległości od środka jednorodnie naładowanej kuli jest pokazany poniżej.

Przykład 1

Atom wodoru traktujemy jako sztywną jednorodnie naładowaną kulę o promieniu R = 10-10 m, całkowitym ładunku Q = e = -1.6·10-19 C i masie me = 9.1·10-31 kg. Proton znajdujący się w środku chmury elektronowej (stan podstawowy) zostaje przemieszczony o małą odległość x0 i puszczony swobodnie. Jaka będzie częstotliwość drgań jakie elektron i proton będą wykonywały wokół ich położeń równowagi?

Siła przywracająca proton do położenia równowagi F = eE czyli

lub

Powinniśmy się posługiwać raczej masą zredukowaną µ =Mpme/(MP + me) ale me << Mp więc µme.

Zgodnie z równaniem dla ruchu harmonicznego

= 2.5·1015 Hz

Ta częstotliwość jest bliska promieniowaniu wysyłanemu przez atom wodoru w pierwszym stanie wzbudzonym czyli, że taki model jest uzasadniony.

Liniowe rozkłady ładunków

Liczymy pole E w odległości r od jednorodnie naładowanego pręta (drutu) o długości l >> r.

Wprowadzamy liniową gęstość ładunku λ (ładunek na jednostkę długości).

Jako powierzchnię Gaussa wybieramy walec (możemy wybierać dowolnie).

Z prawa Gaussa

E jest równoległe do wektora S i ma taką samą wartość w każdym punkcie powierzchni więc

2πrLE = 4πkLλ

(19.3)

Teraz pole wewnątrz. Wybieramy powierzchnię Gaussa o promieniu r < R.

Ładunek wewnątrz powierzchni Gaussa Qwewn. = ρπr2L, gdzie ρ - gęstość objętościowa ładunku. Z prawa Gaussa otrzymujemy

E(2πrL) = 4πk(ρπr2L)

E = 2kρπr

ponieważ

λ = ρπR2

więc

(19.4)

Płaskie rozkłady ładunków

Obliczamy pole od nieskończonej jednorodnie naładowanej płaszczyzny.

Ładunek otoczony przez powierzchnię Gaussa jest równy Qwewn. = σS, gdzie σ jest gęstością powierzchniową, a S powierzchnią podstawy walca. Z prawa Gaussa

2ES = σS/ε0

gdzie czynnik 2 odpowiada dwóm podstawom walca.

Ostatecznie otrzymujemy

E = σ/2ε0 (19.5)

Wiele zastosowań dotyczy układu dwóch, płaskich równoległych płyt (kondensator płaski).

Pole wytwarzane przez płytę "po lewej stronie" (rysunek poniżej) jest równe
Eminus σ/2ε0 i skierowane ku płycie. Pole wytwarzane przez płytę po prawej Eplus = σ/ε0 i skierowane jest od płyty.

Zatem w obszarze I

EI = σ/2ε0 + (– σ/2ε0) = 0

w obszarze II

EII = –σ/2ε0 + (– σ/2ε0) = –σ/ε0

w obszarze III

EIII = (– σ/2ε0) + σ/2ε0 = 0

Powierzchnia przewodnika

Jeżeli przedstawiona na rysunku naładowana powierzchnia stanowi część powierzchni przewodnika to ponieważ cały ładunek gromadzi się na zewnętrznej powierzchni to wewnątrz E = 0. Co więcej E musi być prostopadłe do powierzchni (równoległe do S) bo gdyby istniała składowa styczna to elektrony poruszałyby się.

Z prawa Gaussa wynika, że

ES = (σS)/ε0

więc

E = σ/ε0 (19.6)

na powierzchni przewodnika.

Potencjał elektryczny

Zgodnie z naszymi rozważaniami różnica energii potencjalnych jest dana przez

co dla pola elektrycznego daje

(19.7)

Podobnie jak dla grawitacyjnej energii potencjalnej możemy zdefiniować punkt zerowej energii potencjalnej dla ciała znajdującego się w nieskończoności. Wtedy

Jeżeli przenosimy ładunek q z nieskończoności do punktu odległego o r od innego ładunku punktowego Q, to energia potencjalna jest równa pracy wykonanej przeciw sile elektrycznej, czyli

(19.8)

jest energią potencjalną ładunków q i Q.

Potencjał elektryczny jest definiowany jako energia potencjalna na jednostkowy ładunek

(19.9)

Dla ładunku punktowego

(19.10)

Potencjał = praca potrzebna do przeniesienia jednostkowego ładunku z nieskończoności do r od ładunku punktowego Q.

Różnica potencjałów czyli napięcie U pomiędzy dwoma punktami = praca na przeniesienie ładunku jednostkowego między tymi punktami

(19.11)

Wykład 20

Elektrostatyka II

Obliczanie potencjału

Rozważmy np. różnicę potencjałów (napięcie) pomiędzy środkiem i powierzchnią naładowanej powłoki kulistej.

Ponieważ E = 0 (wzdłuż drogi całkowania) więc tzn. w środku i na powierzchni jest ten sam potencjał.

Z powyższego wzoru wynika, że

(20.1)

Przykład 1

Obliczyć potencjał V i pole E w odległości r od dipola ustawionego wzdłuż osi x. Moment dipolowy p = qL i dodatkowo r >> L.

Jeżeli r >> L to punkt P jest odległy od ładunku +q o:

r – (1/2)Lcosθ

oraz od –q o:

r + (1/2)Lcosθ

Całkowity potencjał jest sumą

Dla r >> L otrzymujemy ostatecznie

Teraz rozpatrzmy pole i różnicę potencjałów dla dwóch przeciwnie naładowanych płyt o polu powierzchni S znajdujących się w odległości d od siebie. Jeżeli ładunki na płytach wynoszą odpowiednio +Q i –Q to gęstości ładunków wynoszą Q/S i –Q/S.

ΔV = – Ed

Zgodnie z naszymi obliczeniami

ΔV = σd/ε0

(20.2)

Na zakończenie zaznaczmy, że powierzchnia każdego przewodnika jest powierzchnią stałego potencjału (powierzchnią ekwipotencjalną).

Pojemność

Kondensator - układ przewodników, który może gromadzić ładunek elektryczny.

Definicja pojemności

(20.3)

Jednostka farad. 1F = 1C/1V.

Powszechnie stosuje się µF, nF, pF.

Dla kondensatora płaskiego na podstawie (20.3) i (20.2)

(20.4)

Energia pola elektrycznego

Początkowo nie naładowany kondensator ładuje się od 0 do napięcia U. Wtedy ładunek wzrasta od 0 do Q, gdzie Q = CU.

Praca zużyta na przeniesienie ładunku dq z okładki "–" na "+" wynosi

dW = Udq

Całkowita praca wynosi więc

(20.5)

Dla kondensatora płaskiego

Podstawiamy to do wzoru na energię i otrzymujemy

Podstawiając wyrażenie na C dostajemy

Sd - objętość kondensatora, więc gęstość energii w = W/Sd

(20.6)

Jeżeli w jakimś punkcie przestrzeni jest pole E to możemy uważać, że jest tam zmagazynowana energia w ilościna jednostkę objętości.

Dielektryki

Rozważaliśmy pole elektryczne od przewodników w próżni.

Stwierdzamy, że umieszczenie materiału nieprzewodzącego (dielektryka) między okładkami kondensatora powoduje zwiększenie pojemności od wartości C do wartości C'.

gdzie κ jest względną przenikalnością elektryczną (stałą dielektryczną).

Dielektryki, pogląd atomistyczny

Dwie możliwości:

  1. cząsteczki polarne np. H2O mające trwałe momenty dipolowe p

  2. cząsteczki (atomy) mają indukowany (przez zewnętrzne pole E) moment dipolowy (przykład z atomem wodoru - Wykład 19).

Przykład 2

Atom wodoru umieszczony w zewnętrznym polu E0.

Siła F = – eE0 przesuwa chmurę elektronową o x0 względem rdzenia (protonu). Wówczas atom ma moment indukowany p = ex0.

Pole w miejscu protonu

E = E0 + Echmura

Ponieważ proton (rdzeń) w położeniu równowagi więc E = 0, skąd dostajemy

Indukowany moment dipolowy jest zatem równy

Elektryczne momenty dipolowe p dążą do ustawienia zgodnie z kierunkiem pola, a momenty indukowane są równoległe do pola. Materiał w polu E zostaje spolaryzowany (rysunek).

W rezultacie dodatni ładunek gromadzi się na jednej, a ujemny na drugiej powierzchni dielektryka. Wewnątrz nie pojawia się żaden ładunek. Indukowany ładunek powierzchniowy q' pojawia się więc gdy dielektryk umieścimy w polu elektrycznym.

Wybieramy powierzchnię Gaussa (linia przerywana).

ES=(q – q')/ε0

E = (q – q')/(ε0S)

Pojemność takiego kondensatora

Dzieląc przez C otrzymamy

Dielektryki - rozważania ilościowe.

Jeżeli każda cząsteczka ma średni moment dipolowy skierowany zgodnie z polem E i jeżeli w dielektryku jest N cząsteczek to całkowity moment dipolowy pcałk = N

Z drugiej strony ładunek (indukowany) jest na powierzchni więc

pcałk = q'd

Łącząc te wyrażenia

q'd = N

q'd = (nSd)

gdzie n jest ilością cząsteczek w jednostce objętości.

q' = nS

Podstawiamy to do wzoru na κ

Obliczyliśmy, że

Podstawiając E = (q – q')/(ε0S)

Wstawiając to do wyrażenia na κ

Obliczamy κ

κ = 1 + 4πnR3

Trzy wektory elektryczne

Przypomnijmy, że: E0 = q/ε0S

Pokazaliśmy, że wprowadzenie dielektryka zmniejsza pole elektryczne (indukowany ładunek daje pole przeciwne do E0)

E = (q – q')/(ε0S) lub E = E0/κ = q/(ε0)

Łącząc te równania dostajemy

Mnożąc przez ε0 i przenosząc wyrazy otrzymujemy

Przepisujemy to równanie w postaci

D = ε0E + P (20.8)

D, E, P są wektorami odpowiednio: indukcji elektrycznej, natężenia pola, polaryzacji.

Na rysunku pokazane są odpowiednie wektory.

D - ładunek swobodny

ε0E - wszystkie ładunki

P - ładunek polaryzacyjny

Wykład 21

Prąd elektryczny i pole magnetyczne

Prąd elektryczny

Natężenie prądu elektrycznego

(21.1)

Jednostka: 1 amper, 1A.

Gęstość prądu elektrycznego

(21.2)

W nieobecności zewnętrznego pola elektrycznego elektrony poruszają się chaotycznie we wszystkich kierunkach. W zewnętrznym polu E uzyskują wypadkową (stałą z założenia) prędkość unoszenia vu.

Jeżeli n jest koncentracją elektronów to ilość ładunku Q jaka przepływa przez przewodnik o długości l w czasie t = l/vu wynosi

Q = nSle

Tak więc natężenie prądu wynosi

(21.3)

a gęstość prądu

(21.4)

gdzie ρ jest gęstością ładunku.

UMOWA: kierunek prądu = kierunek ruchu ładunków dodatnich.

Przykład 1

Prąd o natężeniu 1A płynie w drucie miedzianym o przekroju 1 mm2. Jaka jest średnia prędkość unoszenia elektronów przewodnictwa ? Masa atomowa miedzi µ = 63.8 g/mol, a gęstość ρ = 8.9 g/cm3.

Z równania na natężenie prądu otrzymujemy

Zakładamy, że na jeden atom przypada 1 elektron przewodnictwa (Cu+1). Możemy więc obliczyć koncentrację nośników

n = 8.4·1028 atom/m3

Wstawiając do równania na prędkość otrzymujemy

vu = 7.4·10-5 m/s = 0.074 mm/s

Prądy mogą też płynąć w gazach i cieczach. Lampy jarzeniowe są przykładem wykorzystania przepływu prądu w gazach. W gazach prąd jest wynikiem ruchu nie tylko elektronów ale i jonów dodatnich. Jednak lżejsze elektrony są znacznie szybsze i ich wkład do prądu jest dominujący. W zderzeniu elektronu z jonem lub atomem gazu energia może zostać zaabsorbowana przez atom, a następnie wypromieniowana w postaci promieniowania elektromagnetycznego w tym również widzialnego.

Prawo Ohma

Jeżeli do przewodnika przyłożymy różnicę potencjałów V, to przez przewodnik płynie prąd I. Na początku XIX wieku Ohm zdefiniował opór przewodnika jako napięcie podzielone przez natężenie prądu

(21.5)

Jest to definicja oporu. Ten stosunek jest stały pod warunkiem, że utrzymuje się stałą temperaturę.

Jednostką oporu (SI) jest 1 (Ohm) 1Ω.

Wyprowadzenie prawa Ohma

Bez pola elektrycznego prędkość ruchu chaotycznego u (nie powoduje przepływu prądu). Prędkość u jest związana ze średnią drogą swobodną λ i średnim czasem pomiędzy zderzeniami Δt zależnością: u = λt.

Jeżeli przyłożymy napięcie to na każdy elektron będzie działała siła F = eE i po czasie Δt każdy elektron osiągnie prędkość unoszenia vu = Δu daną II zasadą Newtona

Stąd

Podstawiając Δt = λ/u otrzymujemy

(21.6)

Prędkość unoszenia ma ten sam kierunek (przeciwny do E) dla wszystkich elektronów. Przy każdym zderzeniu elektron traci prędkość unoszenia.

Średnia droga swobodna λ jest tak mała, że vu jest zawsze mniejsza od u.

Obliczamy teraz natężenie prądu wstawiając wyrażenie na vu do wyrażenia (21.3) na natężenie I.

Dla elementu przewodnika o długości l (rysunek) obliczymy opór korzystając z faktu, że napięcie U = El.

Z prawa Ohma

(21.7)

R jest proporcjonalny do długości przewodnika i odwrotnie proporcjonalny do przekroju. Zauważmy, że R pozostaje stały tak długo jak długo u jest stałe, a u zależy tylko od temperatury (patrz wykład 15).

Równanie (21.7) przepiszmy w postaci

(21.8)

Stałą ρ nazywamy oporem właściwym.

Typowa zależność oporu od temperatury dla przewodników metalicznych jest pokazana na rysunku na następnej stronie.

Z dobrym przybliżeniem jest to zależność liniowa ρ ~ T za wyjątkiem temperatur bliskich zera bezwzględnego. Wtedy zaczyna odgrywać rolę tzw. opór resztkowy ρ0 zależny w dużym stopniu od czystości metalu. Istnieją jednak metale i stopy, dla których obserwujemy w dostatecznie niskich temperaturach całkowity zanik oporu. Zjawisko to nosi nazwę nadprzewodnictwa.

Prądy wzbudzone w stanie nadprzewodzącym utrzymują się w obwodzie bez zasilania zewnętrznego. Ta możliwość utrzymania stale płynącego prądu rokuje duże nadzieje na zastosowania techniczne, które znacznie wzrosły po odkryciu w 1987 r materiałów przechodzących w stan nadprzewodzący w stosunkowo wysokich temperaturach, około 100 K. Materiały te noszą nazwę wysokotemperaturowych nadprzewodników a ich odkrywcy Bednorz i Müller zostali wyróżnieni Nagrodą Nobla.

Straty cieplne

Gdy elektron zderza się z atomem traci nadwyżkę energii, którą uzyskał w polu elektrycznym. Ponieważ energia kinetyczna nie wzrasta, cała energia stracona przez elektrony daje

dEcieplna = Udq

gdzie dq jest ładunkiem przepływającym(elektronów przewodnictwa).

Dzieląc obie strony przez dt otrzymujemy

P = UI (21.8)

przedstawia straty mocy elektrycznej.

Siła elektromotoryczna

Aby utrzymać prąd potrzeba źródła energii elektrycznej. Np. baterie, generatory. Nazywamy je źródłami siły elektromotorycznej SEM. W takich źródłach jeden rodzaj energii jest zamieniany na drugi. SEM oznaczamy ε i definiujemy

(21.9)

gdzie W jest energią elektryczną przekazywaną ładunkowi q, gdy przechodzi on przez źródło SEM.

Obwody prądu stałego

Łączenie oporów:

  1. szeregowe (ten sam prąd przez oporniki) Rz = R1 + R2 + .....

  2. równoległe (to samo napięcie na opornikach) 1/Rz = 1/R1 + 1/R2 + .....

Prawa Kirchoffa

Twierdzenie o obwodzie zamkniętym jest wynikiem prawa zachowania energii, a twierdzenie o punkcie rozgałęzienia wynika z prawa zachowania ładunku.

Przykład 2

Regulator napięcia (rysunek).

Opornik R1 ma napięcie określone przez ε1 a prąd pobiera z ε2.

W każdej gałęzi obwodu trzeba z osobna przyjąć kierunek prądu i jego natężenie. Prawdziwy kierunek rozpoznamy po znaku obliczonego natężenia. Spadek napięcia pojawia się przy przejściu przez każdy opornik w kierunku zgodnym z prądem. Przyrost napięcia pojawia się przy przejściu przez źródło od "−" do "+".

Zastosowanie I prawa Kirhoffa do "dużej" pętli daje

ε2I2R2I3R1 = 0

a dla "małej" pętli

ε1I3R1 = 0

Po odjęciu stronami otrzymamy

ε2ε1I2R2 = 0

Dla węzła

I1 + I2I3 = 0

skąd

Zauważmy, że gdy dobrać warunki tak aby

to I1 = 0 i ε1 nie daje żadnego prądu. Taki układ ma ważne zastosowanie praktyczne. Napięcie ε1 może być niskoprądowym ogniwem wzorcowym, mimo że R1 może pobierać duży prąd (głównie z ε2).

Pole magnetyczne

Doświadczalnie stwierdzamy, że występuje oddziaływanie:

  1. magnesów naturalnych (Fe3O4)

  2. oddziaływanie przewodników z prądem na ładunki w ruchu (kineskop)

  3. oddziaływanie przewodników z prądem na siebie

Te oddziaływania opisujemy wprowadzając pojęcie pola magnetycznego.

Siła magnetyczna

Pole grawitacyjne (natężenie)

Pole elektryczne (natężenie)

Pole magnetyczne (indukcja)

(Siła działa na ładunki w ruchu i jest proporcjonalna do qv).

Jednostką B jest tesla; 1T = N/(Am)

Powyższy wzór jest prawdziwy dla ruchu ładunku prostopadle do B ale siła Fmagn (siła Lorentza) zależy od kierunku v. Ta zależność od kierunku jest zapisana poprzez równanie wektorowe

(21.10)

gdzie kierunek definiuje się z reguły śruby prawoskrętnej (iloczyn wektorowy).

Zauważmy, że Fmagn jest zawsze prostopadłe do v. Zatem, zgodnie z twierdzeniem o pracy i energii Fmagn nie może zmienić energii kinetycznej poruszającego się ładunku i ładunek krąży po okręgu. Stąd

jest promieniem okręgu.

Siła działa na ładunki w ruchu więc działa na cały przewodnik z prądem.

F = evuB

W przewodniku o długości l znajduje się nSl elektronów, więc całkowita siła

Równanie w ogólnym przypadku ma postać

(21.11)

Działanie pola magnetycznego na obwód z prądem

Rozważymy teraz działanie pola magnetycznego na zamknięty obwód z prądem.

Prostokątną ramkę o bokach a i b umieszczamy w jednorodnym polu magnetycznym o indukcji B. Przez ramkę płynie prąd o natężeniu I, a normalna do płaszczyzny ramki tworzy kąt θ z polem B (rysunek).

Rozpatrujemy siłę działającą na każdy z boków. Siły Fb działające na odcinki b znoszą się wzajemnie. Siły Fa działające na odcinki a też się znoszą ale tworzą parę sił dającą wypadkowy moment siły

lub wektorowo (na podstawie definicji iloczynu wektorowego)

Siła Fa wynosi

więc

(21.12)

gdzie ab jest powierzchnią ramki. Równanie (21.12) możemy zapisać w postaci wektorowej

(21.13)

gdzie S jest wektorem powierzchni.

Wielkość

(21.14)

nazywamy magnetycznym momentem dipolowym. Pole magnetyczne działa więc na ramkę z prądem (dipol magnetyczny) momentem skręcającym obracając ją. Położenie równowagi ramki (dipola magnetycznego) występuje dla θ = 0 tj. gdy ramka jest ustawiona prostopadle do pola B. Przykładem dipola magnetycznego jest igła kompasu, która umieszczona w polu magnetycznym obraca się ustawiając zgodnie z polem.

Taką "kołową ramką z prądem" jest również elektron krążący po orbicie w atomie. Moment dipolowy elektronu krążącego po orbicie o promieniu r wynosi

Natężenie prądu wytwarzanego przez elektron o ładunku e przebiegający orbitę w czasie T (okres obiegu) wynosi

gdzie v jest prędkością elektronu. Stąd

gdzie L = mvr jest momentem pędu elektronu. Elektron, krążący po orbicie jest więc elementarnym dipolem magnetycznym. Własności magnetyczne ciał są właśnie określone przez zachowanie się tych elementarnych dipoli w polu magnetycznym. Własności te omówimy na dalszych wykładach.

Z momentem siły działającym na dipol związana jest tzw. energia magnetyczna dipola Można również pokazać, że ta energia wyraża się wzorem

Em = ‑ µB = ‑ µBcosθ (21.15)

Zauważmy, że minimum energii odpowiada ustawieniu dipola w kierunku równoległym do pola magnetycznego B (θ = 0).

Efekt Halla

Jeżeli płytkę metalu (lub półprzewodnika) umieścimy w polu magnetycznym, prostopadłym do kierunku przepływu prądu, to na ładunki będzie działała siła odchylająca powodująca zakrzywienie torów ładunków w kierunku jednej ze ścianek bocznych płytki. Niezależnie czy prąd jest związany z ruchem ładunków dodatnich czy ujemnych mamy do czynienia z odchylaniem ładunków w kierunku jednej krawędzi.

Przesunięcie ładunków powoduje powstanie poprzecznego pola elektrycznego Halla EH. To pole przeciwdziała dalszemu przesuwaniu ładunków. Pole Halla jest dane wzorem

W stanie równowagi odchylające pole magnetyczne jest równoważone przez pole elektryczne

qEH + q(vu × B) = 0

Stąd

EH = – vu × B

Wynika stąd, że jeżeli zmierzymy EH i B to możemy znaleźć vu.

Gdy vu i B są prostopadłe to

EH = vuB

Ponieważ:

vu = j/ne

więc

EH = (jB)/(ne) lub n = (jB)/(eEH)

Możemy wyznaczyć n.

Można też wykorzystać ten efekt do pomiaru pola magnetycznego.

Wykład 22

Pole magnetyczne, indukcja elektromagnetyczna

Prawo Ampera

Chcemy teraz znaleźć pole magnetyczne wytwarzane przez powszechnie występujące rozkłady prądów, takich jak przewodniki prostoliniowe, cewki itd.

Pole magnetyczne prezentujemy graficznie rysując tzw. linie pola magnetycznego czyli linie wektora indukcji magnetycznej. Na rysunku pokazane są linie pola magnetycznego wokół prostoliniowego przewodnika z prądem. Wektor B jest styczny do tych linii pola w każdym punkcie.

Linie pola B wytwarzanego przez przewodnik są zamkniętymi współśrodkowymi okręgami w płaszczyźnie prostopadłej do przewodnika. To, że linie pola B są zamknięte stanowi fundamentalną różnicę między polem magnetycznym i elektrycznym, którego linie zaczynają się i kończą na ładunkach.

Zwrot wektora indukcji B wokół przewodnika wyznaczamy stosując następującą zasadę: Jeśli kciuk prawej ręki wskazuje kierunek prądu I, to zgięte palce wskazują kierunek B (linie pola B krążą wokół prądu).

Żeby obliczyć pole B potrzeba nam "magnetycznego" odpowiednika prawa Gaussa.

Związek między prądem i polem B jest wyrażony poprzez prawo Ampera.

Zamiast sumowania (całki) E po zamkniętej powierzchni, w prawie Ampera sumujemy (całkujemy) po zamkniętym konturze (całkę krzywoliniową). Taka całka dla pola E równała się wypadkowemu ładunkowi wewnątrz powierzchni, a w przypadku pola B jest równa całkowitemu prądowi otoczonemu przez kontur, co zapisujemy

(22.1)

gdzie µ0 = 4π·10-7 Tm/A, jest przenikalnością magnetyczną próżni. Tak jak w przypadku prawa Gaussa wynik był prawdziwy dla dowolnej powierzchni zamkniętej tak dla prawa Ampera wynik nie zależy od kształtu konturu zamkniętego

Przykład 1

Obliczmy pole wokół nieskończenie długiego prostoliniowego przewodnika w odległości r od niego.

Z prawa Ampera wynika, że dla konturu kołowego

B2πr = µ0I

Stąd

(22.2)

Strumień magnetyczny

Tak jak liczyliśmy strumień dla pola E (liczbę linii przechodzących przez powierzchnię S) tak też obliczamy strumień pola B

(22.3)

Ponieważ linie pola B są zamknięte więc strumień przez zamkniętą powierzchnię musi być równy zeru (tyle samo linii wchodzi co wychodzi).

Przykładowe rozkłady prądów

Pręt (przewodnik)

Na zewnątrz pręta (r > R) znamy już pole B.

Pole to jest takie jakby cały prąd płynął przez środek pręta (analogie do rozkładu ładunków).

Jeżeli chcemy obliczyć pole wewnątrz pręta to wybieramy kontur kołowy o r < R.

Wewnątrz konturu przepływa prąd i będący tylko częścią całkowitego prądu I

Stąd

B2πr = µ0i

Czyli

Cewka (solenoid)

Solenoidem nazywamy cewkę składającą się z dużej liczby zwojów. Linie pola magnetycznego solenoidu są pokazane schematycznie na rysunku poniżej. Jak widać pole wewnątrz solenoidu jest jednorodne, a na zewnątrz praktycznie równe zeru.

Jeżeli zwoje solenoidu stykają się ze sobą wówczas możemy rozpatrywać solenoid jako układ połączonych szeregowo prądów kołowych (rysunek).

Do obliczenia pola wytwarzanego przez solenoid zastosujemy prawo Ampera, dla konturu pokazanego na rysunku poniżej.

Całkę po konturze zamknietym przedstawimy jako sumę czterech całek

Druga i czwarta całka są równe zeru bo Bl. Trzecia całka jest też równa zero ale to dlatego, że B = 0 na zewnątrz solenoidu. Tak więc niezerowa jest tylko całka pierwsza i równa

gdzie h jest długością odcinka ab.

Teraz obliczmy prąd obejmowany przez kontur.

Jeżeli cewka ma n zwojów na jednostkę długości to wewnątrz konturu jest nh zwojów czyli całkowity prąd przez kontur wynosi:

I = I0nh

gdzie I0 jest prądem przepływającym przez cewkę (przez pojedynczy zwój).

Z prawa Ampera otrzymujemy więc:

Bh = µ0I0nh

czyli

B = µ0I0n (22.4)

Dwa przewodniki równoległe

Dwa przewodniki równoległe umieszczone w odległości d. Płyną w nich prądy Ia i Ib odpowiednio.

Przewodnik a wytwarza w swoim otoczeniu pole

W tym polu znajduje się przewodnik b, w którym przepływa prąd Ib. Na odcinek l tego przewodnika działa siła

(22.5)

Zwrot siły widać na rysunku.

To rozumowanie można "odwrócić" zaczynając od przewodnika b. Wynik jest ten sam.

Fakt oddziaływania przewodników równoległych wykorzystano przy definicji ampera. Załóżmy, że d = 1m oraz, że Ia = Ib = I. Jeżeli dobierzemy tak prąd aby siła przyciągania przewodników, na 1 m ich długości, wynosiła 2·10-7 N to mówimy, że natężenie prądu jest równe 1 amperowi.

Prawo Biota-Savarta

Istnieje inne równanie, zwane prawem Biota-Savarta, które pozwala obliczyć B z rozkładu prądu. Oczywiście to prawo i prawo Ampera muszą być matematycznie równoważne. Prawo Ampera jest jednak "łatwe" w stosowaniu tylko gdy rozkłady prądów są na tyle symetryczne, że obliczenie odpowiedniej całki nie jest trudne. Gdy rozkład prądów jest skomplikowany (nie znamy jego symetrii) to dzielimy prądy na nieskończenie małe elementy (rysunek) i stosując prawo Biota-Savarta obliczamy pole od takich elementów, a następnie sumujemy je (całkujemy) żeby uzyskać wypadkowy wektor B.

Wartość liczbowa dB zgodnie z prawem Biota-Savarta wynosi

a zapisane w postaci wektorowej

(22.6)

Przykład 2

Obliczmy pole B na osi kołowego przewodnika z prądem.

Z prawa B -S otrzymujemy

oraz

Z tych równań otrzymujemy

Ponadto

oraz

Podstawiając otrzymujemy

Zauważmy, że wielkości I, R, x są takie same dla wszystkich elementów prądu.

Całkujemy, żeby obliczyć B (wyłączając stałe czynniki przed znak całki)

Dla x >> R dostajemy

Indukcja elektromagnetyczna

Prawo Faradaya

Zjawisko indukcji elektromagnetycznej polega na powstawaniu prądów elektrycznych w zamkniętym obwodzie podczas przemieszczania się względem siebie źródła pola magnetycznego i tego zamkniętego obwodu. Mówimy, że w obwodzie jest indukowana siła elektromotoryczna (SEM indukcji), która wywołuje przepływ prądu indukcyjnego.

Prawo indukcji Faradaya stosuje się do trzech różnych sytuacji fizycznych:

Na podstawie obserwacji Faraday doszedł do wniosku, że czynnikiem decydującym jest szybkość zmian strumienia magnetycznego φB. Ilościowy związek przedstawia prawo Faradaya

(22.7)

Jeżeli mamy obwód złożony z N zwojów to

Reguła Lenza

Prąd indukowany ma taki kierunek, że przeciwstawia się zmianie, która go wywołała. Kierunek prądu indukowanego w pętli (rysunek) zależy od tego czy strumień rośnie czy maleje (zbliżamy czy oddalamy magnes). Ta reguła dotyczy prądów indukowanych.

Wykład 23

Indukcja elektromagnetyczna, energia pola magnetycznego

Indukcyjność

Transformator

Gdy dwie cewki są nawinięte na tym samym rdzeniu (często jedna na drugiej) to prąd zmienny w jednej wywołuje SEM indukcji w drugiej.

N1 - liczba zwojów w cewce pierwotnej, N2 - liczba zwojów w cewce wtórnej

oraz

Stosunek napięć

(23.1)

Widać, że regulując ilość zwojów w cewkach możemy zamieniać małe napięcia na duże i odwrotnie.

Przykład 1

Obliczmy straty mocy w linii przesyłowej o oporze 10 Ω przesyłanej z generatora 10 MW gdy napięcie wynosi 1.5·104 oraz 105 V.

P = IU

Pstrat = I2 R = (P/U)2 R

Pstrat1 = 4.4 MW (44%)

Pstrat2 = 0.1 MW (1%)

Indukcyjność własna

Gdy natężenie prądu przepływającego przez cewkę zmienia się to zmienia się też strumień przez każdy zwój tej cewki więc zgodnie z prawem indukcji Faradaya indukuje się SEM. Tę siłę elektromotoryczną nazywamy siłą elektromotoryczną samoindukcji.

(23.2)

Wielkość jest całkowitym strumieniem zawartym w obwodzie i nosi nazwę strumienia skojarzonego. Strumień skojarzony jest proporcjonalny do prądu płynącego przez cewkę.

Nφ = LI (23.3)

Stała proporcjonalności

L = Nφ/I (23.4)

nazywana jest indukcyjnością.

Zróżniczkowanie(po czasie) równania (23.3) daje

Stąd

(23.5)

Jednostką L jest henr. 1 H = 1 Vs/A

Jako przykład obliczmy indukcyjność cewki o długości l0 i N zwojach.

Strumień przez każdy zwój wynosi

φ = BS

gdzie B dla cewki wynosi

B = µ0nI = µ0I(N/l0)

Zatem

Indukcyjność L otrzymujemy mnożąc strumień przez N/I

(23.6)

Zauważmy, że L zależy tylko od geometrii.

Indukcja wzajemna

Omawiając transformator pokazywaliśmy, że dwie cewki mogą oddziaływać na siebie. Prąd zmienny w jednej wywoływał SEM w drugiej. Tym razem strumień przechodzący przez cewkę 2 jest proporcjonalny do prądu płynącego przez cewkę 1.

N2φ21 = M21I1

Stałą proporcjonalności M21 nazywamy indukcją wzajemną.

Różniczkując to równanie otrzymujemy

Stąd

Jeżeli zmieniamy prąd I2 to analogicznie

Można pokazać (ale w skomplikowany sposób), że

M12 = M21 = M

Podobnie jak L tak samo M zależy tylko od geometrii układu.

Obwody RC i RL, stałe czasowe

Zaczniemy teraz zajmować się prądami zmieniającymi się w czasie.

Obwód RC

Rozpatrzmy jaki prąd popłynie w obwodzie po zamknięciu wyłącznika do pozycji (a).

Korzystamy z prawa Kirchoffa.

(23.7)

W równaniu tym są dwie niewiadome I oraz q. Ale możemy skorzystać ze związku I = dq/dt. Otrzymujemy równanie różniczkowe

Szukamy rozwiązania q(t). Ma ono postać

(23.8)

Możemy sprawdzić czy funkcja ta jest rozwiązaniem równania różniczkowego poprzez jej podstawienie do tego równania.

Prąd obliczamy różniczkując dq/dt

Rysunki przedstawiają zależność q(t) oraz I(t).

Jeżeli teraz przełączymy wyłącznik do pozycji (b) to będziemy rozładowywać kondensator. Teraz w obwodzie nie ma ε i prawo Kirchoffa przyjmuje postać

czyli

Rozwiązanie ma postać

(23.9)

gdzie q0 jest ładunkiem początkowym na kondensatorze.

Natężenie prądu przy rozładowaniu wynosi

W równaniach opisujących ładowanie i rozładowanie kondensatora wielkość RC ma wymiar czasu i jest nazywana stałą czasową obwodu. Opisuje ona fakt, że ładunek na kondensatorze nie osiąga od razu wartości końcowej lecz zbliża się do niej wykładniczo. Podobnie przy rozładowaniu.

Obwód RL

Analogicznie opóźnienie w narastaniu i zanikaniu prądu pojawia się w obwodzie RL przy włączaniu lub wyłączaniu źródła SEM.

Gdyby nie było cewki prąd osiągnąłby natychmiast wartość ε/R. Dzięki cewce w obwodzie pojawia się dodatkowo SEM samoindukcji εL, która zgodnie z regułą Lenza przeciwdziała wzrostowi prądu (po włączeniu) co oznacza, że jej zwrot jest przeciwny do ε.

Z prawa Kirchoffa otrzymujemy

(23.10)

Poszukujemy rozwiązania tego równania różniczkowego w postaci I(t).

Ma ono postać

(23.11)

Sprawdzamy poprzez podstawienie do równania. Napięcie na oporniku i cewce pokazane jest na rysunkach poniżej.

Narastanie prądu w obwodzie jest opisane stałą czasową τL = L/R.

Jeżeli przełącznik ustawimy w pozycji (b) to wyłączmy źródło SEM i otrzymamy

(23.12)

z rozwiązaniem

(23.12)

Energia, a pole magnetyczne

Pozostańmy przy obwodzie RL. Z prawa Kirchoffa otrzymaliśmy

Mnożąc to równanie przez I dostajemy

Interpretacja tego równania z punktu widzenia pracy i energii jest następująca:

To ostatnie możemy zapisać jako

czyli

Po scałkowaniu otrzymujemy

(23.13)

Równanie określa całkowitą energię magnetyczną zawartą w cewce o indukcyjności L przez, którą płynie prąd I.

Porównajmy to z energią naładowanego kondensatora

(23.14)

Gęstość energii a pole magnetyczne

Rozpatrzmy solenoid o długości l i powierzchni przekroju S czyli o objętości lS.

Tak więc gęstość energii

Ponieważ

więc

Przypomnijmy, że

oraz

co w połączeniu daje wyrażenie

(23.15)

opisujące gęstość energii zawartej w każdym punkcie przestrzeni w której jest indukcja magnetyczna B.

Przykład 2

Długi koncentryczny kabel składa się z cylindrycznych przewodników o promieniach b. Obliczmy energię zawartą w polu magnetycznym kabla na odcinku o długości l0 oraz jego indukcyjność.

Stosując prawo Ampera dla przestrzeni pomiędzy cylindrami otrzymamy

czyli

Gęstość energii w punktach pomiędzy przewodami

Rozpatrzmy teraz cienką (dr) warstewkę pomiędzy cylindrami. Objętość tej warstewki wynosi:

dV = 2πrdrl0

dla odcinka kabla o długości l0.

Energia w tej objętości wynosi więc

Sumując (całkując) po całej objętości obliczamy całkowitą energię W

Indukcyjność znajdziemy z zależności

czyli

L zależy tylko od czynników geometrycznych.

Wykład 24

Drgania elektromagnetyczne

Wstęp

Przypomnienie: masa M na sprężynie, bez oporów. Równanie ruchu

Rozwiązania

x = Acosωt

v = dx/dt = sinωt

a = d2x/dt2 = – 2cosωt

przy warunku ω = (k/M)1/2.

Obwód LC

Rozpatrzmy obwód złożony z szeregowo połączonych indukcyjności L i pojemności C. Opór omowy jest równy zeru (R = 0). Załóżmy, że w chwili początkowej na kondensatorze C jest nagromadzony ładunek qm, a prąd przez cewkę jest równy zeru.

Energia zawarta w kondensatorze

WC = qm2/(2C) (24.1)

jest maksymalna, a energia w cewce

WL = LI2/2 (24.2)

jest równa zeru.

Po zamknięciu obwodu, kondensator rozładowuje się przez cewkę. W obwodzie płynie prąd I = dq/dt. W miarę jak maleje ładunek na kondensatorze maleje też energia zawarta w polu elektrycznym kondensatora, a rośnie energia pola magnetycznego, które pojawia się w cewce w miarę narastania w niej prądu.

Wreszcie gdy ładunek spadnie do zera cała energia jest przekazana do pola magnetycznego cewki. Prąd w cewce indukcyjnej ma maksymalną wartość. Ten prąd ładuje kondensator (przeciwnie) więc energia jest ponownie przekazywana do kondensatora. Stan końcowy jest taki jak początkowy tylko kondensator jest naładowany odwrotnie. Sytuacja powtarza się. Mamy więc do czynienia z oscylacjami ładunku (prądu).

Opis ilościowy

Z prawa Kirchoffa

UL + UC = 0

(24.3)

Ponieważ I = dq/dt więc

(24.4)

To jest równanie analogiczne do przypomnianego równania dla sprężyny, przy czym następujące wielkości są analogiczne

q ↔ x, L ↔ M, 1/C ↔ k

Tak więc możemy napisać rozwiązanie tego równania

q = qmcosωt

I = dq/dt = qmωsinωt = Imsinωt

ω = (1/LC)1/2 (24.5)

gdzie Im = qmω

UL = - LdI/dt = – LImωcosωt

UC = q/c = (qm/C)cosωt

Ponieważ

LImω = Lqmω2 = Lqm(1/LC) = qm/C

widać, że amplitudy napięć są takie same.

Obwód szeregowy RLC

Dotychczas rozważaliśmy obwód zwierający indukcyjność L oraz pojemność C. Tymczasem każdy obwód ma pewien opór R, przykładowo jest to opór drutu z którego nawinięto cewkę. Obecność oporu w obwodzie powoduje straty energii w postaci wydzielającego się ciepła. Energia zawarta w obwodzie maleje i otrzymujemy drgania tłumione analogiczne do drgań tłumionych sprężyny opisanych w wykładzie 12, przy czym współczynnik tłumienia 1/2τ jest równy R/2L.

Drgania w obwodzie RLC można podtrzymać jeżeli obwód będziemy zasilać napięciem sinusoidalnie zmiennym

Prawo Kirchhoffa dla obwodu zawierającego elementy R, L, C oraz źródło SEM ma postać

(24.6)

różniczkując po dt

(24.7)

albo

(24.8)

To jest równanie analogiczne do omawianego dla oscylatora wymuszonego przy R/L ↔ 1/τ, 1/LCω02 oraz ωU0/Lα0.

Rozwiązanie ma więc analogiczną postać .

Amplituda wynosi więc

(24.9)

a między napięciem i natężeniem prądu istnieje różnica faz, dana równaniem

(24.10)

Wyrażenie (24.9) ma postać prawa Ohma przy czym stała proporcjonalności pomiędzy U0 i I0

(24.11)

pełni analogiczną rolę jak opór R w prawie Ohma. Wielkość Z nazywamy impedancją (zawadą) obwodu.

Gdy zmienne sinusoidalne napięcie przyłożymy do kondensatora to

Stąd

co dla U=U0sinωt daje

Stąd

Widać, że prąd wyprzedza napięcie na kondensatorze o 90°.

Maksymalny prąd I0 = U0/(ωC) a stała proporcjonalności 1/ωC pełniąca rolę analogiczną do oporu w obwodzie prądu stałego nazywamy reaktancją pojemnościową.

XC = 1/ωC (24.12)

Jeżeli generator prądu zmiennego podłączymy do cewki indukcyjnej to analogicznie można pokazać, że

Prąd pozostaje za napięciem o 90°, a reaktancja indukcyjna ma wartość

XL = ωL (24.12)

Zauważmy, że w obwodzie RLC, pomimo połączenia szeregowego oporów omowego, pojemnościowego i indukcyjnego ich opór zastępczy (zawada) nie jest prostą sumą tych oporów. Wynika to właśnie z przesunięć fazowych.

Trzeba je uwzględnić przy dodawaniu napięć.

U = UR + UC + UL

czyli

U = I0Rsinωt - XCI0cosωt + XLI0cosωt

(na kondensatorze U pozostaje za I, na cewce U wyprzedza I)

Stąd

Mamy teraz dodać sinus i cosinus graficznie tak jak na rysunku.

Możemy przy tym skorzystać z wyrażenia (24.10) według, którego tgϕ = (XL - XC)/R

.Relacja ta jest pokazana na rysunku poniżej

Zauważmy, ze przeciwprostokątna trójkąta na rysunku jest równa zawadzie  Z = (R2 + (XL - XC)2)1/2.

Rezonans

Drgania ładunku, prądu i napięcia w obwodzie odbywają się z częstością zasilania ω. Amplituda tych drgań zależy od ω i osiąga maksimum dla pewnej charakterystycznej wartości tej częstości. Przypomnijmy, że zjawisko to nazywamy rezonansem. Dla małego oporu R czyli dla małego tłumienia warunek rezonansu jest spełniony gdy

(24.13)

Natężenie prądu osiąga wtedy wartość maksymalną równą

(24.14)

Widzimy, że natężenie prądu w obwodzie jest takie, jak gdyby nie było w nim ani pojemności ani indukcyjności, a zawada wynosiła R.

Przykład

Drgania wymuszone w obwodzie można także wywołać bez włączania bezpośredniego źródła SEM w postaci generatora. Przykładem może być układ RLC w obwodzie wejściowym radioodbiornika (telewizora) pokazany na rysunku poniżej. Układ ten jest zasilany sygnałem z anteny.

W układzie dostrojenie do częstotliwości danej radiostacji jest osiągane przez dobranie pojemności. W ten sposób jest spełniony warunek rezonansu dla tej częstotliwości. Przyjmijmy, że w pokazanym układzie R = 10 Ω, a L = 1 µH. Sprawdźmy, jaka powinna być pojemność C aby uzyskać dostrojenie odbiornika (rezonans) do stacji "Jazz Radio", która w Krakowie nadaje na częstotliwości 101 MHz?

Korzystając z warunku (24.13) otrzymujemy C = 2.48 pF.

W warunkach rezonansu napięcie na kondensatorze (w obwodzie RLC) jest równe

Jeżeli sygnał wejściowy z anteny ma amplitudę 100 µV to napięcie na kondensatorze przy częstotliwości rezonansowej ma wartość 6.35 mV. Dla porównania napięcie na kondensatorze przy tych samych ustawieniach R, L, C i sygnale o tej samej amplitudzie ale o częstotliwości 96.0 MHz (radio "RMF") wynosi 1 mV.

Moc w obwodzie prądu zmiennego

W obwodzie prądu przemiennego moc dana analogicznym wyrażeniem jak dla prądu stałego

(24.15)

ale wartość jej zmienia się bo zmienne jest napięcie i natężenie prądu. Dlatego też w przypadku prądu zmiennego posługujemy się wartościami średnimi. Zgodnie z naszymi obliczeniami moc w obwodzie RLC w dowolnej chwili t wynosi

Korzystając ze wzoru na sinus różnicy kątów otrzymujemy

gdzie skorzystaliśmy z relacji . Moc średnia jest więc dana wyrażeniem

Ponieważ to (wykresy sinus i cosinus są takie same, jedynie przesunięte o π/2). Ponadto bo funkcja sinus jest na przemian dodatnia i ujemna. Uwzględniając, ponadto że U0 = ZI0 oraz, że (zgodnie z rysunkiem na stronie 24-4) otrzymujemy wyrażenie na moc średnią

(24.16)

Jak widzimy, średnia moc zależy od przesunięcia faz. Przypomnijmy, że dla prądu stałego P = I2R. Z porównania tych dwóch wyrażeń dochodzimy do wniosku, że moc średnia wydzielana przy przepływie prądu zmiennego o amplitudzie I0 jest taka sama jak prądu stałego o natężeniu

(24.17)

Tę wielkość nazywamy wartością skuteczną prądu zmiennego. Analogicznie definiujemy skuteczną wartością napięcia prądu zmiennego

(24.18)

Mierniki prądu zmiennego (np. amperomierze i woltomierze) odczytują właśnie wartości skuteczne. Wartość napięcia 220 V w naszej sieci domowej to wartość skuteczna.

Obliczyliśmy moc średnią wydzielaną w całym obwodzie. Porównajmy ją teraz ze średnią mocą traconą na oporze R

Widzimy, że cała moc wydziela się na oporze R, a to oznacza, że na kondensatorze i cewce nie ma strat mocy. Zwróćmy uwagę, że ten wniosek pozostaje w zgodności z naszymi wcześniejszymi obliczeniami. Gdy w obwodzie znajduje się tylko pojemność lub indukcyjność (nie ma oporu omowego) to przesuniecie fazowe jest równe π/2, a ponieważ cos(π/2) = 0 to zgodnie z równaniem (24.16) średnia moc jest równa zeru. Jednocześnie zauważmy, że moc chwilowa zmienia się z czasem; raz jest dodatnia (energia jest gromadzona w polu elektrycznym kondensatora lub magnetycznym cewki), a raz ujemna (zgromadzona moc jest oddawana do układu).

Omawiane obwody, w których elementy R, L, C stanowiły odrębne części nazywamy obwodami o elementach skupionych. W praktyce jednak mamy do czynienia z elementami, które mają złożone własności. Przykładem może tu być cewka, która oprócz indukcyjności L ma zawsze opór R oraz pojemność międzyzwojową C. Mamy wtedy do czynienia z obwodami o elementach rozłożonych.

Wykład 25

Równania Maxwella

Podstawowe równania elektromagnetyzmu

Poszukiwaliśmy zawsze podstawowego (najmniejszego) zestawu równań pozwalającego na pełne opisanie przedmiotu zainteresowań.

W mechanice - trzy zasady dynamiki

W termodynamice - trzy zasady termodynamiki

Teraz chcemy zrobić to samo dla elektromagnetyzmu.

Zacznijmy od poznanych już równań.

Nazwa Równanie

1

2

3

4

prawo Gaussa dla elektryczności

prawo Gaussa dla magnetyzmu

prawo indukcji Faradaya

prawo Ampera

Te równania jak się okaże są niekompletne Konieczne jest wprowadzenie jeszcze jednego dodatkowego wyrazu do równania 4.

Pozwala on w szczególności na udowodnienie, że prędkość światła w próżni c, jest związana z czysto elektrycznymi i magnetycznymi wielkościami.

Prześledźmy powyższą tabelę z punktu widzenia symetrii.

Zwróćmy uwagę, że w tych rozważaniach stałe µ0 i ε0 nie są istotne bo możemy wybrać układ jednostek, w którym będą te stałe równe 1. Wtedy zauważamy pełną symetrię lewych stron równań. Prawe strony NIE są symetryczne.

Przyczynę niesymetrii dla równań 1 i 2 znamy. Wiemy, że istnieją izolowane centra ładunku (np. elektron, proton) ale nie istnieją izolowane centra magnetyczne (pojedyncze bieguny magnetyczne - monopole). Dlatego w równaniu 1 pojawia się q, a w 2 zero.

Z tego powodu mamy w równaniu 4 prąd I = dq/dt, a nie mamy prądu monopoli (ładunków magnetycznych) w równaniu 3.

Drugi rodzaj asymetrii wiąże się z wyrazem – dφB/dt w równaniu 3. Sens tego prawa jest następujący: zmieniające się pole magnetyczne wytwarza pole elektryczne.

Korzystając z zasad symetrii można przypuszczać, że obowiązuje zależność odwrotna: zmieniając pole elektryczne (dφE/dt) wytwarzamy pole magnetyczne .

Indukowane pole magnetyczne

Oczywiście doświadczenie daje przykłady: w kondensatorze (cylindrycznym) pole elektryczne wzrasta (kondensator ładuje się) z prędkością dE/dt co oznacza, że do okładek dopływa ładunek.

Doświadczenie pokazuje, że powstaje tam pole magnetyczne wytworzone przez zmieniające się pole elektryczne.

Trzeba to uwzględnić w naszych równaniach. Jeszcze raz rozpatrzmy cylindryczny kondensator i obliczmy z prawa Ampera pole magnetyczne w punkcie P (rysunek poniżej).

Wybieramy kontur obejmujący płaską powierzchnię S, która zawiera prąd I oraz przechodzi przez punkt P (w odległości r) (). Z prawa Ampera otrzymujemy

Stąd

B2πr=µ0I

Czyli

Prawo Ampera obowiązuje dla dowolnego konturu. Wybieramy więc kontur kołowy na którym rozpięta jest zakrzywiona powierzchnia S'. Żaden prąd nie przechodzi przez tę powierzchnię więc tym razem kontur nie obejmuje prądu i mamy co jest sprzeczne z poprzednim wynikiem. Wynika to z nieciągłości prądu, który nie płynie pomiędzy okładkami kondensatora. Żeby usunąć tę niespójność Maxwell zaproponował dodanie nowego członu do prawa Ampera.

Przez analogię do prawa indukcji Faradaya możemy napisać

(25.1)

Tak więc prawo Ampera po modyfikacji ma postać

(25.2)

Tak więc pole magnetyczne jest wytwarzane przez przepływ prądu ale też przez zmieniające się pole elektryczne.

Sprawdźmy czy stosując tę modyfikację uzyskamy teraz poprawny wynik na pole B w punkcie P (przykład powyżej). W części powierzchni krzywoliniowej S' pomiędzy okładkami kondensatora z prawa Gaussa wynika, że

φE = ESC = q/ε0

gdzie SC jest powierzchnią okładek kondensatora. Różniczkując po dt mamy

Przypomnijmy, że

Podstawiając za I otrzymujemy

czyli dodany wyraz do prawa Ampera.

Prąd przesunięcia

Z poprzedniego równania widać, że wyraz ε0dφE/dt ma wymiar prądu. Mimo, że nie mamy tu do czynienia z ruchem ładunków, to wyraz ten nazywamy prądem przesunięcia. Mówimy, że pole B może być wytworzone przez prąd przewodzenia I lub przez prąd przesunięcia IP.

(25.3)

Koncepcja prądu przesunięcia pozwala na zachowanie ciągłości prądu w przestrzeni gdzie nie jest przenoszony ładunek (np. między okładkami kondensatora).

Przykład 1

Obliczyć indukowane pole magnetyczne w ładowanym kondensatorze cylindrycznym w odległości r od osi (rysunek na stronie 2).

Z równania

otrzymujemy

Stąd

dla r = R = 5cm oraz dE/dt = 1012 V/ms otrzymujemy B = 0.0028 Gs czyli o dwa rzędy mniej niż pole ziemskie.

Natomiast prąd przesunięcia

ma całkiem sporą wartość IP = 70 mA. Powodem, że B jest tak małe jest to, że ten prąd (umowny) jest rozłożony na bardzo dużej powierzchni okładki kondensatora podczas gdy prąd przewodzenia jest "skupiony" w przewodniku.

Równania Maxwella

Prawo Równanie Czego dotyczy Doświadczenie
1 Gaussa dla elektryczności ładunek i pole elektryczne

Przyciąganie, odpychanie ładunków (1/r2).

Ładunki gromadzą się na powierzchni metalu

2 Gaussa dla magnetyzmu pole magnetyczne nie stwierdzono istnienia monopola magnetycznego
3 indukcji Faradaya efekt elektryczny zmieniającego się pola magnetycznego indukowanie SEM w obwodzie przez przesuwany magnes
4 Ampera (rozszerzone przez Maxwella) efekt magnetyczny zmieniającego się pola elektrycznego

prąd w przewodniku wytwarza wokół pole magnetyczne

prędkość światła można wyliczyć z pomiarów EM

Wykład 26

Fale elektromagnetyczne

Maxwell nie tylko wyjaśnił zjawiska elektryczne za pomocą czterech równań, ale wyciągnął z nich wnioski, których nie kojarzono przed nim z elektrycznością. W 1864 r pokazał, że przyspieszony ładunek musi promieniować pole elektryczne i magnetyczne, a następnie, że pola te są do siebie prostopadłe i tworzą kąt prosty z kierunkiem rozchodzenia się fali. Prędkość fal elektromagnetycznych w próżni

(26.1)

Znany nam obecnie zakres widma fal elektromagnetycznych przedstawia rysunek poniżej.

(Omówienie źródeł promieniowania).

Równanie falowe

Przypominamy równanie falowe dla struny

Przez analogię równanie falowe dla fali EM (bez wyprowadzenia)

(26.2)


Linie transmisyjne

Dotyczy problemu przenoszenia fal EM pomiędzy dwoma punktami.

Kabel koncentryczny

Jeżeli przełącznik S (rysunek poniżej) jest połączony z punktem b to przewodniki są na tym samym potencjale.

Jeżeli przełączymy go do pozycji a to między przewodnikami pojawi się różnica potencjałów U. Ta różnica nie wystąpi w całym kablu ale będzie się przenosić wzdłuż kabla ze skończoną prędkością, która dla linii doskonale przewodzącej jest równa prędkości światła c. Na rysunku (a) przedstawiono zależność czasową napięcia między kablami w punkcie odległym o l od źródła. Impuls w kablu w dowolnej chwili t jest pokazany na rysunku (b).

Na rysunku (c) pokazany jest kształt fali otrzymanej przy periodycznym przerzucaniu przełącznika między punktami a i b, a na rysunku (d) kształt fali po zastąpieniu przełącznika oscylatorem sinusoidalnym.

Oczywiście takie zmiany rejestruje się dopiero dla odpowiednich częstości. Dla częstości np. 50 Hz, λ = c/v = 6·106 m = 6000 km oczywiście nie widać w liniach transmisyjnych sygnałów przypominających fale. Ale już dla częstości mikrofalowych rzędu 10 GHz λ = 3 cm.

Pola i prądy w kablu koncentrycznym

Na rysunku ( poniżej) pokazany jest rozkład pola elektrycznego i magnetycznego w kablu koncentrycznym.

Pole elektryczne jest radialne, a pole magnetyczne tworzy współosiowe koła wokół wewnętrznego przewodnika.

Linia transmisyjna ma zerowy opór tzn. pole E nie ma składowej stycznej w dowolnym punkcie powierzchni przewodzącej. To są tzw. warunki brzegowe.

Mamy tu do czynienia z falą bieżącą. Rysunek to tylko jedna z możliwych konfiguracji pól (fali EM) bo ω może się zmieniać w sposób ciągły. Na rysunku dolnym pokazane są prądy (przewodzenia i przesunięcia). Tworzą zamknięte pętle ‑ ciągłość prądu.

Falowód

Istnieje możliwość przesyłania fal EM przez pustą rurę metalową (bez przewodnika wewnętrznego). Ściany tej rury (falowodu) mają oporność zerową. Jej przekrój jest prostokątem. Jeżeli do końca falowodu przyłożymy generator mikrofalowy (klistron) to przez falowód przechodzi fala o rozkładzie pól E, B pokazanym na rysunku poniżej.

Falowód z liniami pola E widzianymi z boku (rys. a), liniami B widzianymi z góry (rys. b), i liniami E widzianymi z przodu (rys c). Dla polepszenia czytelności na rysunku (a) pominięto linie B, a na rysunku (b) linie E.

Pole E nie ma składowej stycznej w żadnym punkcie wewnętrznej powierzchni falowodu. Typ transmisji czyli rozkład pól (typ fali) w falowodzie zależy od jego rozmiarów. Ten podstawowy, dla prostokątnego falowodu, rozkład pól będzie przesyłany pod warunkiem, że częstość ω będzie większa od tzw. częstości odcięcia (granicznej) ω0. Żeby wyeliminować inne rozkłady (nakładanie się ich) wybieramy ω większe od ω0 dla typu podstawowego, a mniejsze od częstotliwości odcięcia dla innych typów. Wtedy podstawowy typ transmisji jest jedynym. Zwróćmy uwagę, że rozkład nie musi być sinusoidalnie zmienny.

Wnęki rezonansowe

Omawialiśmy fale EM bieżące w liniach transmisyjnych. Możliwe jest, podobnie jak dla fal akustycznych, wytworzenie fal EM stojących. Taka fala czyli zespół doscylujących pól B i E może powstać np. w zamkniętym cylindrze wykonanym z dobrego przewodnika (rysunek poniżej). Doprowadzenie fali (z generatora), czyli sprzężenie z linią transmisyjną może być zrealizowane przez mały otwór lub antenę (mały pręt). Podobnie jak dla rezonatora akustycznego (piszczałka organowa, struna) możliwe jest wiele rodzajów drgań z różnymi częstotliwościami.

Formalne potraktowanie drgań we wnęce powinno wyjść od równań Maxwella i kończyć na wzorach opisujących rozkłady pól we wnęce w zależności od czasu i miejsca we wnęce. My ograniczymy się do drgań podstawowych i pokażemy, że są one zgodne z równaniami Maxwella.

Przerywany okrąg przedstawia drogę całkowania przy obliczaniu pola B z prawa Ampera, a przerywany prostokąt drogę całkowania przy wyliczaniu E z prawa Faradaya.

Na rysunku widać pole E oraz B. W tej sytuacji załóżmy, że pole B maleje, a pole E rośnie. Zastosujmy, do prostokąta na rysunku, prawo Faradaya.

E równa się zeru dla górnej drogi całkowania (w ścianie wnęki) oraz dla dróg bocznych bo tam E jest prostopadłe do dl. Tak więc

Łącząc równania otrzymujemy:

E jest więc maksymalne gdy strumień magnetyczny zmienia się najszybciej. W przypadku zmian sinusoidalnych odpowiada to przejściu przez zero (zmianie znaku) B. Więc E ma wartość maksymalną gdy B ma wartość zero w całej wnęce.

Teraz zastosujemy prawo Ampera dla linii pola B widocznych na przekroju (a) wnęki rezonansowej (dla konturu o promieniu r).

Ponieważ żaden ładunek nie przepływa przez kontur więc prąd przewodzenia I = 0. Całka po lewej stronie równania wynosi Br więc

Pole B zależy od szybkości zmian strumienia pola E. Tak jak poprzednio dla sinusoidalnych zmian E maksimum B otrzymamy gdy E zmienia znak.

Widać, że pola E i B podtrzymują się wzajemnie. Raz wzbudzone drgania trwają przy nieobecności strat.

Promieniowanie

Elektromagnetyczna linia transmisyjna może być zakończona na różne sposoby np. wnęką rezonansową. Może też być zakończona w sposób umożliwiający wypromieniowanie energii elektromagnetycznej do otaczającej przestrzeni. Przykładem takiego zakończenia jest elektryczna antena dipolowa pokazana na rysunku poniżej.

Różnica potencjałów pomiędzy między drutami zmienia się sinusoidalnie i efekt jest taki jak w przypadku dipola elektrycznego o momencie dipolowym p zmieniającym się co do wielkości jak i kierunku. Na rysunku poniżej pokazane jest pole E i B wytwarzane przez taki dipol czyli też przez taka antenę. Fale rozchodzą się z prędkością c (w próżni). Przedstawione są pola w dużej odległości od dipola.

Fala elektromagnetyczna emitowana przez drgający dipol elektryczny przechodząc przez odległy punkt P jest falą płaską. Przypomnijmy, że prędkość fali jest dana przez znany wzór c = λv, lub inaczej c = ω / k, gdzie ω = 2πv oraz k = 2π/λ.

Wektor Poyntinga

Jedną z ważnych właściwości fali elektromagnetycznej jest zdolność do przenoszenia energii od punktu do punktu. Szybkość przepływu energii przez jednostkową powierzchnię płaskiej fali elektromagnetycznej można opisać wektorem S zwanym wektorem Poyntinga. Wektor S definiujemy za pomocą iloczynu wektorowego

(26.3)

W układzie SI jest on wyrażony w W/m2, kierunek S pokazuje kierunek przenoszenia energii. Wektory E i B są chwilowymi wartościami pola elektromagnetycznego w rozpatrywanym punkcie.

Wykład 27

Optyka geometryczna i falowa

Wstęp

Odbicie i załamanie

Przypomnienie kilku podstawowych wiadomości:

  1. współczynnik załamania; bezwzględny i względny

n = c/v, n2,1 = v1/v2 (27.1)

  1. prawo odbicia i załamania: promień odbity i załamany leżą w jednej płaszczyźnie utworzonej przez promień padający i prostopadłą do powierzchni odbijającej w punkcie padania (normalna padania) tzn. w płaszczyźnie rysunku poniżej.

  2. dla odbicia θ1 = θ1

  3. dla załamania

Prawa te można wyprowadzić z równań Maxwella, ale jest to matematycznie zbyt trudne. Jednak te prawa optyki można wyprowadzić w oparciu o prostą (ale ważną) zasadę odkrytą w 1650 r przez Pierre Fermata.

Zasada Fermata

Zasadę tę formułujemy w następujący sposób:

Promień świetlny biegnący z jednego punktu do drugiego przebywa drogę, na której przebycie trzeba zużyć w porównaniu z innymi, sąsiednimi drogami, minimum albo maksimum czasu.

Np. najkrótszy czas między dwoma punktami w próżni - linia prosta.

Z tej zasady można wyprowadzić prawa odbicia i załamania.

Na rysunku są przedstawione dwa punkty A i B oraz łączący je promień APB.

Całkowita długość drogi promienia wynosi

gdzie x jest zmienną zależną od położenia punktu P (punkt odbicia promienia).

Zgodnie z zasadą Fermata punkt P (zmienną x) wybieramy tak, żeby czas przebycia drogi APB był minimalny (lub maksymalny, lub niezmieniony). Matematycznie oznacza to warunek

czyli

lub przekształcając

Porównując z rysunkiem widzimy, że jest to równoważne zapisowi

sinθ = sinθ

czyli

θ = θ

co jest prawem odbicia.

Podobnie postępujemy w celu wyprowadzenia prawa załamania. Rozpatrzmy sytuację przedstawioną na rysunku poniżej.

Czas t, przelotu światła, z A do B dany jest wzorem

Uwzględniając n = c/v możemy przepisać to równanie w postaci

Wielkość l = n1l1 + n2l2 nazywamy drogą optyczną promienia (nie mylić z drogą geometryczną równą l1 + l2). Ponownie dobieramy x (punkt P), aby droga l była minimalna czyli, aby dl/dx = 0. Ponieważ droga optyczna wynosi

otrzymujemy

lub po przekształceniu

Porównując to z rysunkiem otrzymujemy

n1sinθ1 = n2sinθ2

co jest prawem załamania.

W omawianych obu przypadkach czas (i droga) był minimalny.

Warunki stosowalności optyki geometrycznej

Omawiając odbicie i załamanie fal (płaskich) posługiwaliśmy się pojęciem promienia. Ta wygodna konstrukcja myślowa przydatna do opisu tych zjawisk nie jest pomocna przy opisie ugięcia światła (fal) gdyż niemożliwe jest wydzielenie pojedynczego promienia z padającej fali płaskiej. Żeby to sprawdzić prześledźmy zachowanie fali płaskiej padającej na szczeliny o różnej szerokości. To zachowanie jest przedstawione schematycznie na rysunku poniżej dla szczelin o szerokości a = 5λ, a = 3λ oraz a = λ.

Widzimy, że ugięcie staje się coraz bardziej wyraźne gdy a/λ → 0.

To ugięcie jest charakterystyczne dla wszystkich rodzajów fal. Dzięki temu możemy np. słyszeć fale głosowe znajdując się za załomem muru.

Ugięcie fal na szczelinie (albo przeszkodzie) wynika z zasady Huyghensa.

Zasada Huyghensa

W tej teorii światła podanej przez Christiana Huyghensa w 1678 r. zakłada się, że światło jest falą ( a nie strumieniem cząstek). Nie wspomina ona o elektromagnetycznym charakterze światła ani nie wyjaśnia, że światło jest falą poprzeczną. Teoria Huyghensa oparta jest na konstrukcji geometrycznej (zwanej zasadą Huyghensa), która pozwala przewidzieć gdzie znajdzie się czoło fali w dowolnej chwili w przyszłości, jeżeli znamy jej obecne położenie. Zasada ta głosi, że wszystkie punkty czoła fali można uważać za źródła nowych fal kulistych. Położenie czoła fali po czasie t będzie dane przez powierzchnię styczną do tych fal kulistych. Poniżej przedstawiony jest na rysunku elementarny przykład obrazujący, za pomocą elementarnych fal Huyghensa, rozchodzenie się fali płaskiej w próżni.

Dane jest czoło fali płaskiej w próżni. Zgodnie z zasadą Huyghensa kilka dowolnie wybranych punktów na tej powierzchni traktujemy jako źródła fal kulistych. Po czasie t promienie tych kul będą równe ct, gdzie c jest prędkością światła. Powierzchnia styczna do tych kul po czasie t jest nową powierzchnią falową. Oczywiście powierzchnia falowa fali płaskiej jest płaszczyzną rozchodzącą się z prędkością c.

Uwaga: Można by oczekiwać ( w oparciu o tę zasadę), że wbrew obserwacji fala Huyghensa może się rozchodzić zarówno do tyłu jak i do przodu. Tę „trudność” w modelu eliminuje się poprzez założenie, że natężenie tych fal kulistych (Huyghensa) zmienia się w sposób ciągły od maksimum dla kierunku „w przód” do zera dla kierunku „w tył”.

Metoda Huyghensa daje się zastosować jakościowo do wszelkich zjawisk falowych. Można przedstawić za pomocą fal elementarnych Huyghensa zarówno odbicie fal jak i ich załamanie.

My zastosujemy je do wyjaśnienia ugięcia fal na szczelinie (przeszkodzie).

Rozpatrzmy czoło fali dochodzącej do szczeliny. Każdy jej punkt możemy potraktować jako źródło fal kulistych Huyghensa. Jednak przez szczelinę przechodzi tylko część fal. Fale leżące poza brzegami szczeliny zostają wyeliminowane i z tym jest związane zaginanie wiązki w obszar tzw. cienia geometrycznego. Szczegóły dotyczące fal ugiętych zostaną przedstawione dokładnie w dalszych wykładach. Tutaj zwróćmy jedynie uwagę na to, że gdy szerokość szczeliny staje się duża (w stosunku do długości fali) a >> λ to ugięcie można zaniedbać. Wydaje się, że światło rozchodzi się po liniach prostych co można przedstawić w postaci promieni podlegających prawom odbicia i załamania. Mówimy, że mamy do czynienia z optyką geometryczną.

Warunkiem stosowalności optyki geometrycznej jest więc aby wymiary liniowe wszystkich obiektów (soczewek, pryzmatów, szczelin itp.) były o wiele większe od długości fali.

Jeżeli tak nie jest to nie możemy przy opisie światła posługiwać się promieniami, lecz trzeba wziąć pod uwagę falowy charakter światła. Widać jak znaczące jest ugięcie fali gdy szczelina ma rozmiar porównywalny z długością fali.

Mamy wtedy do czynienia z optyką falową.

Optyka geometryczna jest więc szczególnym (granicznym) przypadkiem optyki falowej.

Zajmiemy się teraz właśnie optyką falową.

Wykład 28

Interferencja

Doświadczenie Younga

Na wykładzie dotyczącym fal w ośrodkach sprężystych omawiane było nakładanie się fal. Wykazanie, przez Thomasa Younga (w 1801 r.) istnienia takiej interferencji dla światła było pierwszym eksperymentem wskazującym na falowy charakter światła.

Young oświetlił światłem słonecznym ekran, w którym był zrobiony mały otwór S0. Przechodzące światło padało następnie na drugi ekran z dwoma otworami S1 i S2 i rozchodzą się dalej dwie, nakładające się fale kuliste tak jak na rysunku. Warunki stosowalności optyki geometrycznej nie są spełnione i na szczelinach następuje ugięcie fal. Mamy do czynienia z optyką falową. Jeżeli umieścimy ekran w jakimkolwiek miejscu, tak aby przecinał on nakładające się na siebie fale to możemy oczekiwać pojawienia się na nim ciemnych i jasnych plam następujących po sobie kolejno.

Przeanalizujmy teraz doświadczenie Younga ilościowo.

Zakładamy, że światło padające zawiera tylko jedną długość fali (jest monochromatyczne). Na rysunku poniżej punkt P jest dowolnym punktem na ekranie, odległym o r1 i r2 od wąskich szczelin S1 i S2.

Linia S2b została poprowadzona tak, aby PS2 = Pb. Trzeba zwrócić uwagę, że stosunek d/D przedstawiony na rysunku jest dla większej jasności przesadnie duży. Naprawdę << D i wtedy kąt S1S2b jest równy θ z dużą dokładnością.

Oba promienie wychodzące ze szczelin S1 i S2 są zgodne w fazie, gdyż pochodzą z tego samego czoła fali płaskiej. Jednak drogi, po których docierają do punktu P są różne więc i ich fazy mogą być różne. Odcinki Pb i PS2 są identyczne (tak to skonstruowaliśmy) więc o różnicy faz decyduje różnica dróg optycznych tj. odcinek S1b. Aby w punkcie P było maksimum to odcinek S1b musi zawierać całkowitą liczbę długości fal. Jest tak dlatego, że po przebyciu odcinka równego λ faza fali powtarza się więc dla drogi fala ma fazę taką jak na początku tej drogi; odcinek S1b nie wpływa na różnicę faz a ponieważ fale były zgodne w źródle (szczeliny S1 i S2) więc będą zgodne w fazie w punkcie P. Warunek ten możemy zapisać w postaci

S1b = mλ, m = 0, 1, 2, ......,

lub

dsinθ = , m = 0, 1, 2, ......, (maksima) (28.1)

Zauważmy, że każdemu maksimum powyżej punktu O odpowiada położone symetrycznie maksimum poniżej punktu O. Istnieje też centralne maksimum opisywane przez m = 0.

Dla uzyskania minimum w punkcie P, odcinek S1b musi zawierać połówkową liczbę długości fal, to jest:

S1b = (m+1/2) λ, m = 0,1,2,....,

Lub

dsinθ = (m+1/2) λ, m = 0, 1, 2, ......, (minima)

inaczej

dsinθ = (2m+1)λ/2, m = 0, 1, 2, ......, (minima) (28.2)

Przykład 1

Dwie szczeliny odległe od siebie o 1 mm oświetlono światłem zielonym (linia zielona lampy rtęciowej) o długości λ = 546 nm. Jaka jest odległość między sąsiednimi prążkami interferencyjnymi obserwowanymi na ekranie umieszczonym w odległości 1 m od szczelin?

Najpierw sprawdźmy położenie kątowe np. pierwszego maksimum.

Dla m = 1 otrzymujemy: dsinθ = λ

skąd

sinθ = λ/d = (546·10-9 m)/(10-3 m) = 0.000546

co daje

θ ≅ 0.03°

Dla tak małych kątów dobrym jest przybliżenie

sinθ ≅ tgθθ

Z rysunku widać, że tgθ = y/D. Podstawiając to wyrażenie zamiast sinθ w równaniu na maksimum interferencyjne otrzymujemy dla m-tego prążka

a dla następnego

Odległość między nimi wynosi więc

Uwaga: Jeżeli θ jest małe to odległość między prążkami nie zależy od m, czyli prążki są rozmieszczone równomiernie. Jeżeli mamy więcej niż jedną λ to powstaną oddzielne układy prążków (dla każdej z długości fal) o różnym odstępie między prążkami.

Równanie opisujące położenie kątowe maksimów może posłużyć do wyznaczenia długości fali

Z tej relacji T. Young wyznaczył długości fal światła widzialnego.

Koherencja

Podstawowym warunkiem powstania dobrze określonego obrazu interferencyjnego jest, aby fale świetlne które przybywają z punktów S1 i S2 miały dokładnie określoną różnicę faz ϕ stałą w czasie. (Przypomnienie: faza jako określony stan fali w danym miejscu i czasie, patrz równanie opisujące falę E = Emsin(kx-ωt)). Np. jest miejsce na ekranie, dla którego różnica faz wynosi π co oznacza fizycznie, że fale docierające tam wygaszają się (przy założeniu tej samej amplitudy); mamy ciemny prążek. I tak jest zawsze o ile różnica faz się nie zmieni. Gdyby taka zmiana nastąpiła to w tym miejscu natężenie światła nie będzie już równe zeru. Warunkiem stabilności obrazu jest więc stałość w czasie różnicy faz fal wychodzących ze źródeł S1 i S2. Mówimy, że te źródła są koherentne czyli spójne.

Jeżeli szczeliny S1 i S2 zastąpimy przez dwa niezależne źródła fal (np. żarówki) to nie otrzymamy prążków interferencyjnych, ekran będzie oświetlony prawie równomiernie. Interpretujemy to w ten sposób, że różnica faz dla fal pochodzących z niezależnych źródeł zmienia się w czasie w sposób nieuporządkowany.

W krótkim czasie są spełnione warunki dla maksimum, a za chwile (b. krótką np. 10-8 s) dla minimum, a jeszcze za chwilę warunki pośrednie. I tak dla każdego punktu na ekranie. Natężenie (w danym punkcie) jest więc sumą natężeń od poszczególnych źródeł. Mówimy, że te źródła są niespójne, niekoherentne.

Podsumujmy więc podstawową różnicę w opisie, podyktowaną oczywiście przez fakty doświadczalne:

Pozostaje jedynie pytanie jak wytworzyć światło spójne. Na tym etapie zapamiętajmy tylko, że zwykłe źródła światła takie jak żarówki (żarzące się włókno) dają światło niespójne dlatego, że emitujące atomy działają zupełnie niezależnie. Natomiast współcześnie szeroko stosowanymi źródłami światła spójnego są lasery.

Szczegóły dotyczące emisji światła przez lasery jak i zasadę działania lasera poznamy na dalszych wykładach.

Natężenie w doświadczeniu Younga

Załóżmy, że składowe pola elektrycznego obu fal w punkcie P zmieniają się następująco

E1 = E0 sinωt

E2 = E0 sin(ωt+ϕ)

gdzie ω = 2πv jest częstością kołową fal, a ϕ różnicą faz między nimi.

  1. ϕ zależy od położenia punktu P a tym samym od kąta θ

Wynika stąd, że wypadkowe pole elektryczne w punkcie P jest równe

E = E1 + E2

Uwaga: Mówimy o polu E, a nie polu B (fali EM) ponieważ działanie tego drugiego na detektory światła (w tym oko ludzkie) jest znikome. Równanie powyższe powinno być wektorowe ale w tych przypadkach wektory E są do siebie równoległe więc wystarczy równanie algebraiczne.

Podstawiając równania dla obu fal obliczamy pole wypadkowe

E = E0sin(ωt+ϕ) + E0 sinωt = 2E0cos(ϕ/2) sin(ωt+ϕ/2)

Lub

E = Eθsin(ωt+β)

gdzie β = ϕ/2 oraz Eθ = 2E0cosβ

Teraz chcemy obliczyć natężenie fali wypadkowej

IθEθ2

Obliczmy stosunek natężeń dwu fal: fali wypadkowej i fali pojedynczej

czyli

(28.3)

Natężenie zmienia się od zera (dla punktów, w których ϕ = 2β = π) do maksymalnego (dla punktów, w których ϕ = 2β = 0).

Różnica faz wiąże się z różnicą dróg S1b poprzez prostą relację

różnica faz/2π = różnica dróg/λ (28.4)

czyli

Stąd

lub

Poprzez to równanie mamy zależność natężenia od kąta θ.

Narysujmy teraz rozkład natężeń dla interferencji przy dwóch szczelinach (rysunek poniżej) porównując z wynikiem dla pojedynczego źródła jak i dla źródeł niespójnych.

Aby wyliczyć wypadkowe natężenie światła w doświadczeniu Younga dodawaliśmy dwa zaburzenia falowe postaci E1 = E0sinωt, E2 = E0sin(ωt+ϕ), które miały tę samą częstość i amplitudę, a różniły się fazą ϕ. Wynik uzyskany został algebraicznie na podstawie prostych wzorów trygonometrycznych. Jednak metody analityczne stają się znacznie trudniejsze gdy dodajemy więcej zaburzeń falowych (funkcji typu sin, cos) i dlatego wprowadzimy (głównie z myślą o następnych wykładach) prostą metodę graficzną.

Sinusoidalne zaburzenie falowe może być przedstawione graficznie jako obracający się wektor, którego długość reprezentuje amplitudę. Taki wektor będziemy nazywać strzałką fazową (wskazem). Zmienne zaburzenie falowe E1 w chwili t przedstawione jest przez rzut tej „strzałki” na oś pionową (odpowiada to pomnożeniu E0 przez sinωt).

Drugie zaburzenie falowe E2, o tej samej amplitudzie E0, różni się od E1 fazą ϕ. Znajdujemy je podobnie jako rzut „strzałki” na oś pionową. Teraz wystarczy dodać E1 i E2 żeby otrzymać wypadkowe zaburzenie.

Widać to jeszcze lepiej gdy umieści się początek jednej strzałki na końcu poprzedniej zachowując różnicę faz (rysunek poniżej).

Przykład 2

Znajdźmy wypadkową następujących zaburzeń falowych: E1 = 2sinωt, E2 = 2sin(ωt+30°), E3 = 2sin(ωt+60°), E4 = 2sin(ωt+90°).

Jeżeli przyjmiemy np., że ωt = 15° to EM = 6.7, E = 5.8 (rysunek poniżej).

Na kolejnym rysunku pokazane są strzałki fazowe dla interferencji Younga (w chwili = 0).

Eθ = 2E0cosβ = EMcosβ

Suma kątów w trójkącie wynosi 180° stąd wynika, że: 2β = ϕ (taki sam wynik jaki otrzymaliśmy algebraicznie).

Maksimum amplitudy otrzymamy jak widać dla ϕ = 0 (wektory równoległe), a minimum dla ϕ = π (wektory antyrównoległe).

Interferencja w cienkich błonkach

Barwy cienkich błonek, baniek mydlanych, plam np. oleju na wodzie są wynikiem interferencji. Na rysunku pokazana jest warstwa o grubości d i współczynniku załamania n.

Warstwa jest oświetlona przez rozciągłe źródło światła monochromatycznego. W źródle istnieje taki punkt S, że dwa promienie wychodzące z tego punktu mogą dotrzeć do oka po przejściu przez punkt a. Promienie te przebiegają różne drogi gdyż jeden odbija się od górnej, a drugi od dolnej powierzchni błonki. To czy punkt a będzie jasny czy ciemny zależy od wyniku interferencji fal w punkcie a. Fale te są spójne, bo pochodzą z tego samego punktu źródła światła. Jeżeli światło pada prawie prostopadle to geometryczna różnica dróg pomiędzy obu promieniami wynosi prawie 2d. Można więc oczekiwać, że maksimum interferencyjne (punkt a jasny) wystąpi gdy odległość 2d będzie całkowitą wielokrotnością długości fali. Okazuje się, że tak nie jest z dwu powodów

v = λv

oraz, że przy przejściu do innego ośrodka zmienia się prędkość i długość fali, a częstotliwość pozostaje bez zmiany. Ponieważ przy przejściu z powietrza do materiału o współczynniku załamania n prędkość maleje n razy

v = c/n

to długość fali też maleje n razy

λn = λ/n

Możemy teraz uwzględnić oba czynniki tj. różnice dróg optycznych oraz zmiany faz przy odbiciu.

Dla dwóch promieni pokazanych na rysunku warunek na maksimum ma postać

2d = n + λn/2, m = 0, 1, 2, ....,

Czynnik λn/2 opisuje zmianę fazy przy odbiciu (od górnej powierzchni) bo zmiana fazy o 180° (π) jest równoważna różnicy dróg równej połowie długości fali (różnica faz/2π = różnica dróg/λ). Ponieważ λn = λ/n otrzymujemy więc

, m = 0, 1, 2,..... (maksima)

Analogiczny warunek na minimum ma postać

, m = 0, 1, 2,....(minimum)

Równania te są słuszne jeżeli współczynnik załamania błonki jest większy lub mniejszy od współczynnika załamania ośrodków po obu stronach błonki.

Przykład 3

Błonka wodna (np. bańka mydlana, n = 1.33) znajdująca się w powietrzu ma grubość 320 nm. Jaki kolor ma światło odbite, gdy błonka jest oświetlona światłem białym padającym prostopadle?

Z warunku na maksimum obliczamy λ

Obliczamy λ dla kolejnych m:

m = 0, λ = 1700 nm, poza zakresem widzialnym

m = 1, λ = 567 nm, w zakresie widzialnym (żółtozielona)

m = 2, λ = 340 nm, poza zakresem widzialnym

m = 3, 4, ...., poza zakresem widzialnym.

Wykład 29

Dyfrakcja

Zjawisko dyfrakcji (ugięcia) odkrył Grimaldi (XVII w). Polega ono na uginaniu się promieni świetlnych przechodzących w pobliżu przeszkody (np. brzeg szczeliny).

Wyjaśnienie dyfrakcji w oparciu o zasadę Huyghensa - Fresnel (przełom XVIII i XIX w). (W jego czasach wierzono, że fale świetlne są falami mechanicznymi w przenikającym wszechświat eterze. Dopiero Maxwell pokazał, że fale świetlne są falami elektromagnetycznymi, a Einstein odrzucił postulat konieczności istnienia eteru).

Rysunek (a) pokazuje ogólnie na czym polega dyfrakcja.

Fala ze źródła S pada na szczelinę B i przechodzące przez otwór pada na ekran C. Natężenie w punkcie P można obliczyć dodając do siebie wszystkie zaburzenia falowe (tj. wektory E). Te zaburzenia falowe mają różne amplitudy i fazy ponieważ:

Taka sytuacja gdy fale opuszczające otwór nie są płaskie (promienie nie są równoległe) pojawia się gdy źródło fal S i ekran (C), na którym powstaje obraz znajdują się w skończonej odległości od ekranu ze szczeliną (B). Taki przypadek nosi nazwę dyfrakcji Fresnela. Obliczenia natężeń światła są w tej sytuacji trudne.

Całość upraszcza się, gdy źródło S i ekran C odsuniemy na bardzo duże odległości od otworu uginającego. Ten graniczny przypadek nazywamy dyfrakcją Fraunhofera. Czoła fal padających jak i ugiętych są płaszczyznami (promienie są równoległe) tak jak to widać na rysunku (b).

Warunki do wystąpienia dyfrakcji Fraunhofera można zrealizować w laboratorium za pomocą dwu soczewek (rysunek c).

Pierwsza soczewka zmienia falę rozbieżną w równoległa, a druga skupia w punkcie P fale płaskie opuszczające otwór. Wszystkie promienie oświetlające punkt P opuszczają otwór równolegle do linii przerywanej (przechodzącej przez środek soczewki). Warunki dyfrakcji Fraunhofera były z założenia spełnione w doświadczeniu Younga.

W dalszej części wykładu będziemy zajmować się tylko dyfrakcją Fraunhofera.

Pojedyncza szczelina

Rysunek pokazuje falę płaską padającą prostopadle na szczelinę o szerokości a. Rozpatrzmy punkt środkowy P0 ekranu. Równoległe promienie przebywają do tego punktu te same drogi optyczne (różne geometryczne) tzn. promienie zawierają tę samą ilość długości fal (soczewki cienkie). Ponieważ w szczelinie promienie są zgodne w fazie to po przebyciu takich samych dróg optycznych nadal pozostają zgodne w fazie. Dlatego w środkowym punkcie P0 będzie maksimum.

Rozpatrzmy teraz inny punkt P1 na ekranie (rysunek poniżej). Promienie docierające do P1 wychodzą ze szczeliny pod kątem θ. Jeden promień ma początek u góry szczeliny, a drugi w jej środku. (Promień xP1 przechodzi przez środek soczewki więc nie jest odchylany).

Jeżeli wybierzemy punkt P1 tak, żeby różnica dróg bb’ wynosiła λ/2 to promienie zgodne w fazie w szczelinie będą miały w punkcie P1 fazy przeciwne i wygaszą się. Podobnie każdy inny promień wychodzący z górnej połowy szczeliny będzie się wygaszał z odpowiednim promieniem z dolnej połówki leżącym w odległości a/2 poniżej. Punkt P1 będzie miał natężenie zerowe (pierwsze minimum dyfrakcyjne). Warunek opisujący to minimum ma następującą postać

czyli

asinθ = λ

Uwaga: Gdyby szerokość szczeliny była równa λ wtedy pierwsze minimum pojawiłoby się dla θ = 90° czyli środkowe maksimum wypełniłoby cały ekran. W miarę rozszerzania szczeliny środkowe maksimum staje się węższe. (Podobnie było dla interferencji Younga w miarę zmiany odległości między szczelinami punktowymi). Podobne rozważania możemy powtórzyć dla wielu punktów szczeliny i otrzymamy ogólne wyrażenie dla minimów obrazu dyfrakcyjnego w postaci

asinθ = , m = 1, 2, 3,...... (minimum) (29.1)

Mniej więcej w połowie między każdą para sąsiednich minimów występują oczywiście maksima natężenia.

Pojedyncza szczelina, rozważania jakościowe

Teraz chcemy znaleźć wyrażenie na rozkład natężenia w całym obszarze dyfrakcyjnym w funkcji kąta θ. Teraz zrobimy to jakościowo.

Wyobraźmy sobie, że szczelinę o szerokości a dzielimy na N pasków o małej szerokości Δx. Każdy pasek jest źródłem fal kulistych Huyghensa, które wytwarzają na ekranie określone zaburzenie falowe.

Różnica dróg między sąsiednimi paskami wynosi Δxsinθ stąd różnica faz Δϕ pomiędzy falami pochodzącymi z sąsiednich pasków wynosi

czyli

Zatem w punkcie P dodaje się N wektorów (pól elektrycznych E) o tej samej amplitudzie ΔE0, tej samej częstości i tej samej różnicy faz Δϕ między kolejnymi wektorami.

Szukamy zatem zaburzenia wypadkowego dla różnych punktów P, tzn. dla różnych kątów θ, tzn. dla różnych Δϕ.

Poniżej na rysunkach przedstawione jest zaburzenie wypadkowe dla kilku różnych miejsc na ekranie.

Zwróćmy uwagę, że długość łuku jest zawsze równa EM ale amplituda Eθ jest różna. Wektory na rysunku odpowiadają amplitudom (a nie natężeniom). Żeby otrzymać natężenia trzeba je podnieść do kwadratu. W przeciwieństwie do obrazu interferencyjnego natężenia kolejnych maksimów nie są jednakowe.

Pojedyncza szczelina, rozważania ilościowe

Na rysunku poniżej jest przedstawiona konstrukcja służąca do obliczenia natężenia światła w przypadku dyfrakcji na jednej szczelinie. Sytuacja odpowiada tej pokazanej na poprzednim rysunku (b).

Jeżeli szczelinę podzielimy na nieskończenie wiele małych pasków o szerokości dx to łuk strzałek będzie łukiem koła o promieniu R. Długość łuku wynosi Em czyli równa jest amplitudzie w środku obrazu dyfrakcyjnego (linia prosta strzałek).

Kąt ϕ w dolnej części rysunku przedstawia różnicę fazy między skrajnymi wektorami w łuku tzn. ϕ jest różnicą faz pomiędzy promieniami wychodzącymi z góry i dołu szczeliny.

Jak widać z rysunku

czyli

(29.2)

W mierze łukowej

Stąd

Podstawiając do równania (29.2) otrzymamy

czyli

(29.3)

gdzie α = ϕ/2.

Przypomnijmy, że ϕ jest różnicą faz dla promieni wychodzących z krańców szczeliny. Ponieważ różnica dróg dla tych promieni wynosi asinθ (a szerokość szczeliny) więc możemy posłużyć się znanym związkiem

różnica faz/2π = różnica dróg/λ 

otrzymując

lub

(29.4)

Teraz możemy już obliczyć natężenie światła dla dyfrakcji na pojedynczej szczelinie. Natężenie jest proporcjonalne do kwadratu amplitudy. Otrzymujemy więc

(29.5)

Wyrażenie na natężenie przyjmuje wartość minimalną dla

α = mπ, m = 1, 2, 3,....

Podstawiając do równania (29.4) otrzymujemy

asinθ = , m = 1, 2, 3, ..... (minimum)

Jest to wynik zgodny z uzyskanym poprzednio (rozważania jakościowe).

Obliczmy teraz względne natężenia kolejnych maksimów dyfrakcyjnych.

Maksima leżą w środku pomiędzy minimami, a więc w punktach, dla których

α = (m+1/2)π, m = 1, 2, 3,.......

Podstawiając to do równania (29.5) na natężenie otrzymujemy

Iθ/Im = 0.045, 0.016, 0.008 dla m = 1, 2, 3. Widać, że natężenia kolejnych maksimów bardzo szybko maleją.

Na rysunku poniżej przedstawiono krzywe Iθ dla różnych szerokości szczeliny (w stosunku do długości fali λ) w funkcji położenia na ekranie (kąta θ).

Równoczesna interferencja i dyfrakcja na dwóch szczelinach

W doświadczeniu Younga szczeliny były wąskie ( a << λ) tak, że każda ze szczelin oświetlała równomiernie ekran. Jeżeli takie fale (spójne) interferowały to otrzymywaliśmy prążki o jednakowym natężeniu.

Dla realnych szczelin trudno jest zrealizować warunek a << λ. Oznacza to, że pojedyncza szczelina będzie dawała obraz dyfrakcyjny i interferencja fal da teraz obraz, w którym natężenia prążków nie będą stałe (jak w doświadczeniu Younga) ale zależne od tego obrazu dyfrakcyjnego.

Odejście od założenia a << λ powoduje głównie zmianę natężenia prążków (ich położenia pozostają prawie nie zmienione).

Przypomnijmy, że obraz interferencyjny dla dwóch szczelin dany jest równaniem

gdzie

przy czym d jest odległością między szczelinami.

Natomiast natężenie fali ugiętej na szczelinie jest dane równaniem

gdzie

przy czym a jest szerokością szczeliny.

Teraz chcemy otrzymać łączny efekt. Dlatego w równaniu dla interferencji stałą amplitudę (dla wąskich szczelin) zastępujemy realnym natężeniem dyfrakcyjnym. Otrzymujemy

(29.6)

Ten wynik opisuje następujące fakty. W pewnym punkcie ekranu natężenie światła, z każdej szczeliny osobno, jest dane przez obraz dyfrakcyjny tej szczeliny. Obrazy dyfrakcyjne dwóch szczelin rozpatrywanych oddzielnie nakładają się (fale interferują). Rysunek poniżej jest wykresem powyższego równania dla d = 50λ i trzech wartości stosunku a/λ.

Obwiednie prążków interferencyjnych pokrywają się dokładnie z obrazem dyfrakcyjnym. Obraz jest więc iloczynem czynnika interferencyjnego i dyfrakcyjnego (rysunek poniżej). Czynnik interferencyjny (cos2β) jest pokazany na górnym wykresie, czynnik dyfrakcyjny (sinα/α)2 na środkowym, a ich iloczyn na dolnym.

Wykład 30

Siatki dyfrakcyjne

Siatki dyfrakcyjne

Rozpatrzymy teraz przypadki gdy liczba centrów rozpraszania jest większa. Tzn. rozpatrzmy naturalne rozszerzenie doświadczenia Younga poprzez zwiększenie liczby szczelin od dwu do większej liczby N.

Układ zawierający zespół N równoległych szczelin nazywamy siatką dyfrakcyjną (szczelin może być b. dużo np. 104/cm).

Na rysunku poniżej pokazany jest rozkład natężeń dla N = 5 szczelin.

Dla przypomnienia poniżej pokazano wynik w doświadczeniu Younga.

Z tych rysunków widać, że zwiększenie liczby szczelin

Maksima główne wystąpią gdy spełniony jest znany warunek

dsinθ = , m = 0, 1, 2, (maksima) (30.1)

gdzie m nazywamy rzędem widma, a d jest odległością między szczelinami (stała siatki dyfrakcyjnej).

Uwaga: Położenia maksimów głównych nie zależą od N.

Pochodzenia maksimów wtórnych można wyjaśnić za pomocą metody strzałek fazowych (wskazów).

Siatki dyfrakcyjne są często stosowane do pomiarów długości fali i do badań struktury i natężenia linii widmowych.

Przykład 1

Siatka dyfrakcyjna ma 4000 nacięć na 1 cm. Pada na nią prostopadle światło żółte z lampy sodowej. W świetle tym występują dwie fale o długościach 589.00 i 589.59 nm. Pod jakim kątem występuje maksimum dla pierwszego rzędu dla 1 z tych linii? Jaka jest odległość kątowa pomiędzy maksimami pierwszego rzędu dla tych linii?

Maksimum pierwszego rzędu otrzymujemy z warunku

dsinθ =

dla m = 1

sinθ = λ/d = 0.236

θ = 13.6°

Najprostszym sposobem znalezienia odległości kątowej jest powtórzenie obliczeń dla λ = 589.59 i odjęcie obliczonych kątów ale trzeba prowadzić bardzo precyzyjne obliczenia tzn. dla wielu liczb znaczących (nie tak jak powyżej).

Powtarzamy obliczenia

dla λ = 589.00 nm θ = 13.6270°

dla λ = 589.59 nm θ = 13.6409°

stąd

Δθ = 0.0139°

Możemy jednak przeprowadzić bezpośrednie obliczenia tej różnicy.

W tym celu zróżniczkujemy nasze równanie

Otrzymujemy wtedy

Ponieważ długości fal mało się różnią więc możemy zapisać

skąd mamy

Oczywiście otrzymujemy ten sam wynik ale obliczenia wymagają tylko 2 cyfr znaczących zamiast 5 (jak λ).

Wielkość jest nazywana dyspersją kątową siatki dyfrakcyjnej i informuje o odległości kątowej (rozdzieleniu) dwóch fal o mało różniących się długościach.

Dyfrakcja promieni Roentgena (promieni X)

Promienie X są falami elektromagnetycznymi o długościach fal rzędu 0.1 nm.

(Dla przypomnienia światło żółte z przykładu 1 ma długość równą 589 nm.)

W 1912 r. Max von Laue zauważył, że ciała stałe zawierające regularny układ atomów mogą stanowić naturalną, trójwymiarową „siatkę dyfrakcyjną” dla promieniowania X. (Standardowe optyczne siatki dyfrakcyjne są bezużyteczne bo λ << d.).

Rysunek poniżej pokazuje wiązkę promieni X, o widmie ciągłym, padającą na kryształ. Wiązki promieni powstałe w wyniku interferencji fal ugiętych na atomach padają na kliszę tworząc na niej charakterystyczny układ punktów zwany obrazem Lauego. Analiza położeń i natężeń tych punktów pozwala na określenie struktury kryształu.

Na kolejnym rysunku pokazana jest komórka elementarna kryształu NaCl.

Małe kule przedstawiają jony sodu, a duże jony chloru.

Jest to najmniejsza jednostka, z której można zbudować kryształ (cegiełka) poprzez dodawanie jej (powielanie) w trzech prostopadłych kierunkach.

Każda komórka elementarna NaCl zawiera 4 jony sodu i cztery jony chloru czyli cztery cząsteczki NaCl (poza jonem w środku, pozostałe należą też do komórek sąsiednich).

Dla NaCl długość boku komórki elementarnej wynosi 0.562737 nm (porównać z długością fali promieniowania X).

Natężenia linii siatki dyfrakcyjnej zależą od geometrii pojedynczej szczeliny. W idealnym przypadku zależą od szerokości szczeliny.

Tak samo natężenia wiązek rozproszonych na krysztale zależą od geometrii pojedynczej rozpraszającej komórki elementarnej.

Prawo Bragga

Prawo Bragga podaje warunki, w jakich jest możliwa dyfrakcja promieni Roentgena krysztale. Rysunek poniżej pokazuje ugięcie wiązki promieni X na zespole równoległych płaszczyzn (linie przerywane). Odległość między płaszczyznami wynosi d.

W krysztale można wybrać wiele różnych rodzin płaszczyzn o różnych odległościach międzypłaszczyznowych.

Rysunek (a) pokazuje falę oddziałującą z rodziną płaszczyzn, z których jedna jest pokazana na rysunku (b).

Ugięcie następuje na elementarnych centrach rozpraszania (komórki elementarne - odpowiednik pojedynczej szczeliny).

Promienie ugięte będą się sumować gdy różnica dróg będzie równa całkowitej wielokrotności długości fali.

ab’ – ab = ab(cosβ − cosθ) = , k = 0, 1, 2,

Dla k = 0 otrzymujemy β = θ tzn. płaszczyzna wyznaczona przez atomy działa jak „zwierciadło” odbijające falę padającą (kąt padania = kąt odbicia) tzn. w tym kierunku jest wzmocnienie promieniowania ugiętego.

Jeżeli chcemy otrzymać wzmocnienie promieniowania odbitego od całej rodziny płaszczyzn dla kierunku określonego przez kąt θ to muszą się wzmacniać promienie odbite od poszczególnych płaszczyzn. Oznacza to, że różnica dróg dla promieni odbitych od sąsiednich płaszczyzn musi być równa całkowitej wielokrotności λ, tak więc

2dsinθ = , m = 1, 2, 3,....

Zależność ta została podana przez W. L. Bragga i stąd nazwa prawo Bragga.

W równaniu tym d oznacza odległość między sąsiednimi płaszczyznami.

Stąd widać, że dyfrakcja promieni X jest metodą doświadczalną w badaniu rozmieszczenia atomów w kryształach.

Aby otrzymać wyniki ilościowe trzeba znać długość fali promieniowania X.

Wykład 31

Polaryzacja

Teoria przewiduje, że światło podobnie jak każda fala elektromagnetyczna jest falą poprzeczną. Kierunki drgań wektorów E i B są prostopadłe do kierunku rozchodzenia się fali. Na rysunku poniżej przedstawione falę elektromagnetyczną, która ma jeszcze dodatkowo pewną charakterystyczną własność:

wektory E są do siebie równoległe we wszystkich punktach fali. Podobnie wektory B.

Mówimy, że ta fala jest płasko spolaryzowana (spolaryzowana liniowo).

Drgający wektor E tworzy z kierunkiem ruchu fali płaszczyznę zwaną płaszczyzną drgań.

W fali spolaryzowanej liniowo wszystkie takie płaszczyzny są równoległe.

Z dotychczas opisanych doświadczeń z interferencją i dyfrakcją nie można wydedukować poprzecznej natury fal świetlnych ponieważ fale podłużne też interferują i ulegają dyfrakcji.

Podstawy doświadczalne przyniosło następujące doświadczenie.

Young wywnioskował z tego faktu, że światło jest falą poprzeczną i że płaszczyzny drgań w tych falach są prostopadłe względem siebie.

Zauważmy, że chcemy dodać dwa zaburzenia falowe takie jak w doświadczeniu Younga tj. ale prostopadłe do siebie.

Można udowodnić, że fale świetlne spolaryzowane liniowo o równych amplitudach i prostopadłych kierunkach drgań nie interferują ze sobą dając jednakowe (niezależnie od różnicy faz) natężenie światła na ekranie. Tu tylko zauważmy, że te dwie fale nigdy się nie wygaszają.

W fali poprzecznej, spolaryzowanej liniowo, należy określić dwa kierunki:

  1. kierunek drgania (np. wektora E),

  2. kierunek rozchodzenia się fali.

(Zauważmy, że w fali podłużnej te dwa kierunki się pokrywają.)

Przykładem fal spolaryzowanych liniowo są fale elektromagnetyczne radiowe (oraz mikrofale) emitowane przez antenę dipolową.

W antenie takiej fale wytwarzane są przez ładunek elektryczny drgający w górę i w dół anteny. Taka fala w dużej odległości od dipola, na osi prostopadłej, ma wektor pola elektrycznego równoległy do osi dipola (anteny) jest więc spolaryzowana liniowo. Kiedy taka fala pada na drugi dipol wówczas zmienne pole elektryczne (zmienny wektor E fali) wywołuje w antenie odbiorczej drgania elektronów do góry i w dół (prąd zmienny). Jeżeli jednak obrócimy antenę o 90° wokół kierunku padania fali, to wektor E będzie prostopadły do anteny i nie wywoła ruchu elektronów (antena nie odbiera sygnału).

Źródła światła widzialnego różnią się od źródeł fal radiowych i mikrofal min. tym, że atomy (cząsteczki) emitujące światło działają niezależnie.

W konsekwencji światło rozchodzące się w danym kierunku składa się z niezależnych ciągów fal, których płaszczyzny drgań zorientowane są przypadkowo wokół kierunku ruchu fali (rysunek poniżej). Takie światło chociaż jest falą poprzeczną jest niespolaryzowane.

Rysunek poniżej pokazuje różnicę między falą poprzeczną spolaryzowaną liniowo (a) i falą poprzeczną niespolaryzowaną (b). Rysunek (c) przedstawia inny równoważny opis niespolaryzowanej fali poprzecznej; tutaj traktujemy ją jako złożenie dwóch spolaryzowanych liniowo fal o przypadkowo zmiennej różnicy faz.

Orientacja kierunków drgań pól E względem kierunku rozchodzenia się fali jest też przypadkowa (ale prostopadła).

Dla zbadania fal świetlnych niespolaryzowanych potrzeba znaleźć metodę, która pozwoliłaby rozdzielić fale o różnych płaszczyznach drgań.

Płytki polaryzujące

Na rysunku (poniżej) światło niespolaryzowane pada na płytkę z materiału polaryzującego, zwanego polaroidem.

W płytce istnieje pewien charakterystyczny kierunek polaryzacji zaznaczony liniami równoległymi. Płytka przepuszcza tylko te fale, dla których kierunki drgań wektora elektrycznego są równoległe do kierunku polaryzacji, a pochłania te fale, w których są one prostopadłe.

Kierunek polaryzacji ustala się w procesie produkcji:

Żeby zanalizować natężenie światła przechodzącego przez polaryzator rozpatrzmy ciąg fal padający na polaroid tak, że wektor E wyznaczający płaszczyznę drgań tworzy kąt θ z kierunkiem polaryzacji płytki (rysunek).

Ten ciąg fal jest równoważny ciągom fal o składowych Ex i Ey (składowe wektora E).

Składowa równoległa Ey = Ecosθ jest przepuszczana podczas gdy składowa prostopadła Ex = Esinθ jest pochłaniana.

Postawmy teraz na drodze światła drugą płytkę polaryzującą (tak zastosowaną płytkę nazywamy analizatorem). Jeżeli płytkę drugą (analizator) będziemy obracać wokół kierunku padania światła to natężenie światła przechodzącego przez obie płytki będzie się zmieniać osiągając minimum dla położeń różniących się o 180° tj. przy prostopadłych kierunkach polaryzacji obu płytek.

Jeżeli amplituda pola elektrycznego fali padającej na analizator jest równa Em to amplituda fali wychodzącej z analizatora wynosi Emcosθ, gdzie θ jest kątem pomiędzy kierunkami polaryzacji obu płytek. Ponieważ natężenie światła jest proporcjonalne do kwadratu amplitudy więc otrzymujemy

I = Imcos2θ (30.1)

Zauważmy, że I ma maksimum dla θ = 0° lub θ = 180° a minimum dla θ = 90° lub θ = 270°. Powyższe równanie zwane jest prawem Malusa.

Znane są jeszcze inne sposoby otrzymywania światła spolaryzowanego. Niektóre omówione są poniżej.

Polaryzacja przez odbicie

W 1809 r. Malus odkrył, że światło może być częściowo lub całkowicie spolaryzowane przez odbicie. Rysunek przedstawia wiązkę niespolaryzowaną padającą na powierzchnię szkła.

Wektor E można rozłożyć na dwie składowe:

Dla światła całkowicie niespolaryzowanego obie składowe maja jednakowe amplitudy.

Stwierdzono doświadczalnie, że dla szkła (i innych materiałów dielektrycznych) istnieje pewien kąt padania, nazywany kątem całkowitej polaryzacji αp, dla którego współczynnik odbicia składowej π jest równy zero. Wtedy wiązka odbita jest spolaryzowana liniowo prostopadle do płaszczyzny padania. Wiązka przechodząca jest tylko częściowo spolaryzowana (składowa π jest całkowicie załamana, a składowa σ tylko częściowo). Zwróćmy uwagę, że wiązka załamana ma większe natężenie od wiązki odbitej.

Doświadczalnie stwierdzono, że gdy kąt padania jest równy kątowi całkowitej polaryzacji to wówczas wiązka odbita i załamana tworzą kąt prosty co oznacza że

α + β = 90°

Natomiast z prawa załamania mamy

Z obu tych równań otrzymujemy

albo

(30.2)

przy czym promień pada z ośrodka 1 i załamuje się w ośrodku 2.

To ostatnie równanie jest nazywane prawem Brewstera.

Prawo to zostało znalezione doświadczalnie ale oczywiście można je wyprowadzić ściśle przy pomocy równań Maxwella.

Załamanie podwójne

Dotychczas milcząco zakładaliśmy, że prędkość światła, a więc i współczynnik załamania, nie zależą od kierunku rozchodzenia się światła w ośrodku ani od jego polaryzacji. Ciała spełniające te warunki nazywamy ciałami optycznie izotropowymi. Istnieje jednak szereg ciał anizotropowych (nie izotropowych).

Dotyczy to nie tylko własności optycznych ale wielu innych. Np. pewne kryształy łamią się łatwo tylko w jednej płaszczyźnie, opór elektryczny mierzony w różnych kierunkach jest różny. Kryształy łatwiej magnesuje się w jednym kierunku niż innych itd.

Uwaga: Ciała polikrystaliczne (złożone z wielu małych kryształków) z powodu przypadkowej orientacji kryształków mogą wydawać się izotropowymi.

Na początku wykładu wspomniany został eksperyment z kryształem kalcytu.

Na rysunku poniżej niespolaryzowana wiązka światła pada na kryształ kalcytu prostopadle do jednej z jego ścian.

Pojedyncza wiązka rozszczepia się na powierzchni kryształu na dwie.

Mamy do czynienia z podwójnym załamaniem.

Możemy zanalizować obie wychodzące wiązki za pomocą płytki polaryzującej.

Okazuje się, że obie wiązki są spolaryzowane liniowo, przy czym ich płaszczyzny drgań są wzajemnie prostopadłe. Wiązki te są oznaczone przez o i e.

Jeżeli zmienimy kąt padania to okaże się, że jedna z wiązek tzw. promień zwyczajny o spełnia prawo załamania (tak jak dla ośrodka izotropowego) a druga wiązka tzw. promień nadzwyczajny e nie spełnia tego prawa.

Na rysunku kąt padania jest równy zeru więc i kąt załamania też powinien być zerowy i tak jest dla promienia o ale nie dla promienia e.

Różnicę tę można wyjaśnić następująco:

Wielkości ne i n0 nazywamy głównymi współczynnikami załamania kryształu.

Niektóre podwójnie załamujące kryształy mają interesującą własność nazywaną dichroizmem, polegającą na tym, że jedna ze składowych polaryzacji jest pochłaniana silniej niż druga. Własność ta jest pokazana na rysunku na następnej stronie. Na tej zasadzie opiera się działanie szeroko stosowanych polaroidów.

Zamiast dużej płytki wyciętej z kryształu można zastosować wiele małych kryształów o osiach optycznych ustawionych równolegle do siebie.

Niektóre przezroczyste ciała bezpostaciowe jak szkła czy tworzywa sztuczne optycznie izotropowe pod wpływem przyłożonych naprężeń mechanicznych stają się optycznie anizotropowe.

Fakt ten jest szeroko wykorzystywany w technice do badania naprężeń w różnych konstrukcjach i mechanizmach.

Naprężenia można wyznaczyć ilościowo, budując model plastyczny urządzenia, które poddaje się działaniu różnych sił. Anizotropię optyczną, jaka przy tym powstaje w modelu, bada się przy pomocy polaryzacji.

Wykład 32

Światło a fizyka kwantowa

Źródła światła

Najbardziej znanymi źródłami światła są rozgrzane ciała stałe i gazy, w których zachodzi wyładowanie elektryczne; np.

Promieniowanie wysyłane przez ogrzane (do pewnej temperatury) ciała nazywamy promieniowaniem termicznym.

Wszystkie ciała emitują takie promieniowanie do otoczenia, a także z tego otoczenia je absorbują.

Jeżeli ciało ma wyższą temperaturę od otoczenia to będzie się oziębiać ponieważ szybkość promieniowania przewyższa szybkość absorpcji (ale oba procesy występują !!). Gdy osiągnięta zostanie równowaga termodynamiczna wtedy te prędkości będą równe.

Za pomocą spektrometru możemy zanalizować światło emitowane przez te źródła tzn. dowiedzieć się jak silnie i jakie długości fal wypromieniowuje.

Dla przykładu, na rysunku poniżej pokazane jest widmo promieniowania dla taśmy wolframowej ogrzanej do T = 2000 K.

Zanotujmy, że:

Zwróćmy uwagę, że w zwykłych temperaturach większość ciał jest dla nas widoczna dlatego, że odbijają one (lub rozpraszają) światło, które na nie pada a nie dlatego, że ciała te wysyłają promieniowanie widzialne (świecą). Jeżeli nie pada na nie światło (np. w nocy) to są one niewidoczne.

Dopiero gdy ciała mają wysoką temperaturę wtedy świecą własnym światłem. Ale jak widać z rysunku i tak większość emitowanego promieniowania jest niewidzialna bo przypada na zakres promieniowania cieplnego (podczerwień). Dlatego ciała, świecące własnym światłem są bardzo gorące.

Jeżeli będziemy rozgrzewać kawałek metalu to początkowo chociaż jest on gorący to z jego wyglądu nie można tego stwierdzić (bo nie świeci); można to tylko zrobić dotykiem. Emituje więc promieniowanie podczerwone (ciepło). Ze wzrostem temperatury kawałek metalu staje się początkowo ciemno-czerwony, następnie jasno-czerwony, aż wreszcie świeci światłem niebiesko-białym.

Wielkość Rλ przedstawiona na wykresie na osi pionowej nazywana jest widmową zdolnością emisyjną promieniowania i jest tak zdefiniowana, ze wielkość Rλdλ oznacza szybkość, z jaką jednostkowy obszar powierzchni wypromieniowuje energię odpowiadającą długościom fal zawartym w przedziale λ, λ+dλ.

Czasami chcemy rozpatrywać całkowitą energię wysyłanego promieniowania w całym zakresie długości fal. Wielkość ta nazywana jest całkowitą emisja energetyczna promieniowania R. Emisję całkowitą R możemy obliczyć sumując emisję dla wszystkich długości fal tzn. całkując Rλ po wszystkich długościach fal.

Oznacza to, że możemy interpretować emisję energetyczną promieniowania R jako powierzchnię pod wykresem Rλ od λ.

Ilościowe interpretacje widm promieniowania przedstawiają poważne trudności.

Dlatego posługujemy się wyidealizowanym obiektem (modelem), ogrzanym ciałem stałym, zwanym ciałem doskonale czarnym. (Takie postępowaliśmy już w przypadku gazów; rozważaliśmy modelowy obiekt tzw. gaz doskonały.)

Przykładem takiego ciała może być obiekt pokryty sadzą (obiekt nie odbija światła, jego powierzchnia absorbuje światło).

My jednak omówimy inny przykład.

Ciało doskonale czarne

Rozważmy trzy bloki metalowe posiadające puste wnęki wewnątrz (takie jak na rysunku). W ściankach tych bloków wywiercono otworki (do tych wnęk).

Promieniowanie pada na otwór z zewnątrz i po wielokrotnych odbiciach od wewnętrznych ścian zostaje całkowicie pochłonięte. Oczywiście ścianki wewnętrzne też emitują promieniowanie, które może wyjść na zewnątrz przez otwór (przykład - otwór okienny).

Każdy z tych bloków (np. wolfram, tantal, molibden) ogrzewamy równomiernie do jednakowej temperatury np. 2000 K. Bloki znajdują się w nieoświetlonym pomieszczeniu, tak że obserwujemy tylko światło wysyłane przez nie.

Pomiary wykonane pokazują, że:

(32.1)

gdzie σ jest uniwersalną stałą (stała Stefana-Boltzmana) równą 5.67·10-8 W/(m2K). Dla zewnętrznych powierzchni to empiryczne prawo ma postać:

gdzie zdolność emisyjna e jest wielkością zależną od substancji i, co jeszcze bardziej skomplikowane, od temperatury.

Rλ dla ciała doskonale czarnego zmienia się z temperaturą tak jak na rysunku poniżej.

Długość fali dla której przypada maksimum emisji jest odwrotnie proporcjonalna do temperatury ciała.

Uwaga: Krzywe te zależą tylko od temperatury i są całkiem niezależne od materiału oraz kształtu i wielkości ciała czarnego.

Rozpatrzmy teraz, pokazane na rysunku poniżej, dwa ciała doskonale czarne (dwie wnęki).

Promieniowanie oznaczone RA przechodzi z wnęki A do wnęki B, a promieniowanie RB w odwrotnym kierunku. Jeżeli te szybkości nie byłyby równe wówczas jeden z bloków ogrzewałby się a drugi stygł. Oznaczałoby to pogwałcenie drugiej zasady termodynamiki. Mamy więc

RA = RB = RC

gdzie RC opisuje całkowite promieniowanie dowolnej wnęki.

Nie tylko energia całkowita ale również jej rozkład musi być taki sam dla obu wnęk. Stosując to samo rozumowanie co poprzednio można pokazać, że

RλA = RλB = RλC

gdzie RλC oznacza widmową zdolność emisyjną dowolnej wnęki.

Teoria promieniowania we wnęce, prawo Plancka

Rozważania klasyczne

Na przełomie ubiegłego stulecia Rayleigh i Jeans wykonali obliczenia energii promieniowania we wnęce (czyli promieniowania ciała doskonale czarnego).

Najpierw zastosowali oni klasyczną teorię pola elektromagnetycznego do pokazania, że promieniowanie wewnątrz wnęki ma charakter fal stojących (węzły na ściankach wnęki).

Zgodnie z fizyką klasyczną, energia każdej fali może przyjmować dowolną wartość od zera do nieskończoności, przy czym energia jest proporcjonalna do kwadratu amplitudy.

Następnie Rayleigh i Jeans obliczyli wartości średniej energii w oparciu o znane nam prawo ekwipartycji energii i w oparciu o nią znaleźli widmową zdolność emisyjną.

Uzyskany wynik jest pokazany na wykresie na stronie 3 (teoria klasyczna). Jak widać rozbieżność między wynikami doświadczalnymi i teorią jest duża. Dla fal długich (małych częstotliwości) wyniki teoretyczne są bliskie krzywej doświadczalnej, ale dla wyższych częstotliwości wyniki teoretyczne dążą do nieskończoności podczas gdy gęstość energii zawsze pozostaje skończona. Ten sprzeczny z rzeczywistością wynik rozważań klasycznych nazywany jest „katastrofą w nadfiolecie”.

Teoria Plancka promieniowania ciała doskonale czarnego

W 1900 roku Max Planck przedstawił Berlińskiemu Towarzystwu Fizycznemu empiryczny wzór opisujący widmową zdolność emisyjną dający wyniki zgodne z doświadczeniem.

(32.2)

Wzór ten stanowił modyfikację znanego już prawa Wiena i chociaż ważny nie stanowił sam nowej teorii (był to wzór empiryczny).

Próbując znaleźć taką teorię Planck założył, że atomy ścian zachowują się jak oscylatory elektromagnetyczne, które emitują (i absorbują) energię do wnęki, z których każdy ma charakterystyczną częstotliwość drgań.

Rozumowanie Plancka doprowadziło do przyjęcia dwóch radykalnych założeń dotyczących tych oscylatorów atomowych:

  1. Oscylator nie może mieć dowolnej energii, lecz tylko energie dane wzorem

E = nhv (32.3)

gdzie v oznacza częstość oscylatora, h -stałą (zwaną obecnie stałą Plancka), n ‑ pewną liczbę całkowitą (zwaną obecnie liczbą kwantową).

Z powyższego wzoru wynika, że energia jest skwantowana i może przyjmować tylko ściśle określone wartości. Tu jest zasadnicza różnica bo teoria klasyczna zakładała dowolną wartość energii od zera do nieskończoności.

  1. Oscylatory nie wypromieniowują energii w sposób ciągły, lecz porcjami czyli kwantami. Kwanty są emitowane gdy oscylator przechodzi z jednego stanu o danej energii do drugiego o innej energii

ΔE = Δnhv = hv

gdy n zmienia się o jedność.

Dopóki oscylator pozostaje w jednym ze swoich stanów kwantowych (stany stacjonarne) dopóty ani nie emituje ani nie absorbuje energii.

Sprawdźmy czy ta hipoteza stosuje się do znanych nam oscylatorów takich jak np. sprężyna o masie m = 1 kg i stałej sprężystości k = 20 N/m wykonująca drgania o amplitudzie 1 cm. Dla takiej sprężyny częstotliwość drgań własnych wynosi

Wartość energii całkowitej (mechanicznej) tej sprężyny wynosi

Jeżeli energia jest skwantowana to jej zmiany dokonują się skokowo przy czym Δhv. Względna zmiana energii wynosi więc

ΔE/E = 4.7·10-31

W celu zaobserwowania (zarejestrowania) tych nieciągłych zmian energii trzeba by wykonać pomiar energii z dokładnością przewyższającą wielokrotnie czułość przyrządów pomiarowych.

Tak więc dla „dużych” oscylatorów natura kwantowa drgań nie jest widoczna podobnie jak w układach makroskopowych nie widzimy dyskretnej natury materii (cząsteczek, atomów, elektronów itp.).

Wnioskujemy, że doświadczenia ze zwykłym wahadłem nie mogą rozstrzygnąć o słuszności postulatu Plancka.

Zanim przejdziemy do przedstawienia innych doświadczeń (zjawisko fotoelektryczne i efekt Comptona) omówmy zastosowanie prawa promieniowania w termometrii.

Zastosowanie prawa promieniowania w termometrii

Promieniowanie emitowane przez gorące ciało można wykorzystać do wyznaczenia jego temperatury. Jeżeli mierzy się całkowite promieniowanie, to można zastosować prawo Stefana-Boltzmana.

Przykład 1

Średnia ilość energii (na jednostkę czasu) promieniowania słonecznego padającego na jednostkę powierzchni Ziemi wynosi 355 W/m2. Jaką temperaturę będzie miała powierzchnia Ziemi, jeżeli przyjąć, że Ziemia jest ciałem doskonale czarnym, wypromieniowującym w przestrzeń właśnie tyle energii na jednostkę powierzchni i czasu?

(Wynik bardzo dobrze zgodny z doświadczeniem.)

Ponieważ dla większości źródeł trudno dokonać pomiaru całkowitego promieniowania więc mierzy się ich zdolność emisyjną dla wybranego zakresu długości fal. Z prawa Plancka wynika, że dla dwu ciał o temperaturach T1 i T2 stosunek natężeń promieniowania o długości fali λ wynosi

Jeżeli T1 przyjmiemy jako standardową temperaturę odniesienia to możemy wyznaczyć T2 wyznaczając doświadczalnie I1/I2.

Do tego celu posługujemy się pirometrem (rysunek poniżej).

Obraz źródła (o nieznanej temperaturze) powstaje w miejscu gdzie znajduje się włókno żarowe pirometru. Dobieramy prąd żarzenia tak aby włókno stało się niewidoczne na tle źródła (świeci tak samo jasno). Ponieważ urządzenie jest wyskalowane możemy teraz odczytać temperaturę źródła.

Zjawisko fotoelektryczne

Na rysunku przedstawiono aparaturę do badania zjawiska fotoelektrycznego. W szklanej bańce, w której panuje wysoka próżnia, znajdują się dwie metalowe elektrody A i B.

Poniżej pokazana jest zależność prądu fotoelektrycznego od przyłożonego napięcia (różnicy potencjałów V).

Gdy V jest dostatecznie duże, wtedy prąd fotoelektryczny osiąga maksymalną wartość (prąd nasycenia). Wszystkie elektrony wybijane z płytki A docierają do elektrody B. Jeżeli zmienimy znak napięcia V, to prąd nie spada do zera natychmiast (przy V = 0 mamy niezerowy prąd).

Oznacza to, że fotoelektrony emitowane z płytki A mają pewną energię kinetyczną.

Nie wszystkie elektrony mają jednakowo duża energię kinetyczną bo tylko część z nich dolatuje do elektrody B (prąd mniejszy od maksymalnego). Przy dostatecznie dużym napięciu (V0) zwanym napięciem hamowania prąd zanika. Różnica potencjałów V0 pomnożona przez ładunek elektronu e jest miarą energii najszybszych elektronów (przy V0 nawet najszybsze elektrony są zahamowane, nie dochodzą do B)

Ekmax = eV0 (32.4)

Krzywe a i b na rysunku różnią się natężeniem padającego światła (Ib > Ia). Widać więc, że Ekmax nie zależy od natężenia światła. Zmienia się tylko prąd nasycenia, a to oznacza, że wiązka o światła większym natężeniu wybija więcej elektronów (ale nie szybszych).

Wynik innego doświadczenia pokazuje kolejny rysunek.

Pokazano tu zależność napięcia hamowania od częstotliwości światła padającego dla sodu. (Millikan, Nobel w 1923).

Zauważmy, że istnieje pewna wartość progowa częstotliwości, poniżej której zjawisko fotoelektryczne nie występuje.

Opisane zjawisko fotoelektryczne ma trzy cechy, których nie można wyjaśnić na gruncie klasycznej falowej teorii światła:

  1. Z teorii klasycznej wynika, że większe natężenia światła oznacza większe pole elektryczne E (I ~ E2). Ponieważ siła działająca na elektron wynosi eE więc gdy rośnie natężenie światła to powinna rosnąć ta siła, a w konsekwencji energia kinetyczna elektronów. Tymczasem stwierdziliśmy, że Ekmax nie zależy od natężenia światła.

  2. Zgodnie z teorią falową zjawisko fotoelektryczne powinno występować dla każdej częstotliwości światła pod warunkiem dostatecznego natężenia. Jednak dla każdego materiału istnieje progowa częstotliwość v0, poniżej której nie obserwujemy zjawiska fotoelektrycznego bez względu na jak silne jest oświetlenie.

  3. Ponieważ energia w fali jest „rozłożona” w całej przestrzeni to elektron absorbuje tylko niewielką część energii z wiązki (bo jest bardzo mały). Można więc spodziewać się opóźnienia pomiędzy początkiem oświetlania, a chwilą uwolnienia elektronu (elektron musi mieć czas na zgromadzenie dostatecznej energii). Jednak nigdy nie stwierdzono żadnego mierzalnego opóźnienia czasowego.

Einsteinowi udało się wyjaśnić efekt fotoelektryczny dzięki nowemu założeniu, że energia wiązki świetlnej rozchodzi się w przestrzeni w postaci skończonych porcji (kwantów) energii zwanych fotonami. Energia pojedynczego fotonu jest dana wzorem

E = hv (32.5)

Przypomnijmy sobie, że Planck utrzymywał, że źródło emituje światło w sposób nieciągły ale w przestrzeni rozchodzi się ono jako fala elektromagnetyczna.

Hipoteza Einsteina sugeruje, że światło rozchodzi się w przestrzeni nie jak fala ale jak cząstka. Stosując tę hipotezę do efektu fotoelektrycznego otrzymamy

hv = W + Ekmax (32.6)

gdzie hv oznacza energię fotonu. Równanie to głosi, że jeden foton dostarcza energii hv, która w części (W) zostaje zużyta na wyrwanie elektronu z materiału (jego przejście przez powierzchnię). Ewentualny nadmiar energii (hv – W) elektron otrzymuje w postaci energii kinetycznej, przy czym część z niej może być stracona w zderzeniach wewnętrznych (przed opuszczeniem materiału).

Rozpatrzmy teraz ponownie (z nowego punktu widzenia) trzy cechy fotoefektu nie dające się wyjaśnić za pomocą klasycznej teorii falowej.

  1. Podwajając natężenie światła podwajamy liczbę fotonów a nie zmieniamy ich energii. Ulega więc podwojeniu fotoprąd a nie Ekmax, która nie zależy tym samym od natężenia.

  2. Jeżeli mamy taką częstotliwość, że hv0 = W to wtedy Ekmax = 0. Nie ma nadmiaru energii. Wielkość W nazywamy pracą wyjścia dla danej substancji. Jeżeli v < v0 to fotony niezależnie od ich liczby (natężenia światła) nie mają dosyć energii do wywołania fotoemisji.

  3. Dostarczana jest energia w postaci skupionej (kwant, porcja) a nie rozłożonej (fala).

Możemy przepisać równanie dla fotoefektu w postaci

(32.7)

Widać, że teoria przewiduje liniową zależność pomiędzy napięciem hamowania, a częstotliwością, co jest całkowicie zgodne z doświadczeniem.

Teoria fotonowa całkowicie potwierdza więc fakty związane ze zjawiskiem fotoelektrycznym, wydaje się jednak być sprzeczna z teorią falową, która też potwierdzona została doświadczalnie (np. dyfrakcja).

Nasz obecny punkt widzenia na naturę światła jest taki, że ma ono dwoisty charakter, tzn. w pewnych warunkach zachowuje się jak fala, a w innych jak cząstka, czyli foton. Ta dwoista natura będzie jeszcze omawiana na dalszych wykładach.

Efekt Comptona

Doświadczalne potwierdzenie istnienia fotonu jako skończonej porcji energii zostało dostarczone prze Comptona w 1923 r (Nobel w 1927).

Wiązka promieni X o dokładnie określonej długości fali pada na blok grafitowy (rysunek poniżej).

Compton mierzył natężenie wiązki rozproszonej pod różnymi kątami jako funkcję λ. Wyniki pokazane są na następnej stronie. Widać, że chociaż wiązka padająca na grafit ma jedną długość fali to rozproszone promienie X mają maksimum dla dwóch długości fali. Jedna z nich jest identyczna jak λ fali padającej, druga λ' jest większa (dłuższa) o Δλ. To tzw. przesunięcie Comptona zmienia się z kątem obserwacji rozproszonego promieniowania X (czyli λ' zmienia się z kątem).

Jeżeli padające promieniowanie potraktujemy jako falę to pojawienie się fali rozproszonej o długości λ' nie da się wyjaśnić.

Compton potrafił wyjaśnić swoje wyniki przyjmując, że wiązka promieni X nie jest falą, a strumieniem fotonów o energii hv. Założył on, że fotony (jak cząstki) ulegają zderzeniu z elektronami swobodnymi w bloku grafitu. Podobnie jak w typowych zderzeniach (np. kule bilardowe) zmienia się kierunek poruszania się fotonu oraz jego energia (część energii przekazana elektronowi). To ostatnie oznacza zmianę częstotliwości i zarazem długości fali. Sytuacja ta jest schematycznie pokazana na rysunku poniżej.

Stosując zasadę zachowania pędu oraz zasadę zachowania energii (stosujemy wyrażenia relatywistyczne) otrzymamy ostatecznie wynik

(32.8)

gdzie m0 jest masą elektronu (spoczynkową).

Tak więc przesunięcie Comptona zależy tylko od kąta rozproszenia.

Pozostaje tylko wyjaśnić występowanie maksimum dla nie zmienionej λ. Za ten efekt odpowiedzialne są zderzenia z elektronami rdzenia jonowego. W zderzeniu odrzutowi ulega cały jon o masie M. Dla węgla (grafitu) M = 22000 m0 więc otrzymujemy niemierzalnie małe przesunięcie Comptona.

Wykład 33

Model atomu Bohra

Wstęp

Do roku 1910 znano wiele wyników eksperymentalnych, które wskazywały na to, że atomy zawierają elektrony (np. zjawisko fotoelektryczne).

Ponieważ w normalnych warunkach atomy są elektrycznie obojętne, a zatem muszą one mieć ładunek dodatni równy ujemnemu.

Ponieważ masa elektronów jest bardzo mała w porównaniu z masą najlżejszych nawet atomów oznaczało ponadto, że ładunki dodatnie związane są ze znaczną masą.

Tego typu rozważania prowadziły do pytania, jak wygląda rozkład ładunków dodatnich i ujemnych w atomie.

J. J. Thomson zaproponował model budowy atomu, zgodnie z którym ujemnie naładowane elektrony znajdują się wewnątrz pewnego obszaru wypełnionego w sposób ciągły ładunkiem dodatnim („ciasto z rodzynkami”).

Ładunek dodatni tworzył kulę o promieniu rzędu 10‑10 m. W tej kuli ładunki ujemne byłyby rozłożone równomiernie (w wyniku sił odpychania).

W atomie znajdującym się w stanie o najniższej energii elektrony były nieruchome. Natomiast w atomach o wyższej energii, tzn. w atomach wzbudzonych (np. w wysokiej temperaturze) elektrony wykonywałyby drgania wokół położeń równowagi.

Uwaga: Zgodnie z prawami elektrodynamiki klasycznej każde naładowane ciało poruszające się ruchem przyspieszonym wysyła promieniowanie elektromagnetyczne. Dowód wykracza poza ramy tego wykładu ale przypomnijmy sobie jeszcze raz antenę dipolową. Zmienne pole elektryczne w antenie wywołuje drgania ładunku (prąd zmienny) i antena emituje falę elektromagnetyczną.

Tak więc drgający elektron wysyłałby promieniowanie i w ten sposób model Thomsona wyjaśniał zjawisko emisji promieniowania przez wzbudzone atomy.

Jednak zgodności ilościowej z doświadczeniem nie uzyskano.

Ostateczny dowód nieadekwatności modelu Thomsona otrzymał w 1911 r. jego uczeń E. Rutherford analizując wyniki rozpraszania cząstek α na atomach.

Z przeprowadzonej przez Rutherforda analizy wynikało, że ładunek dodatni nie jest rozłożony równomiernie wewnątrz atomu, ale skupiony w małym obszarze zwanym jądrem (o rozmiarze 10-14 m) leżącym w środku atomu.

Model jądrowy atomu zaproponowany przez Rutherforda znalazł potwierdzenie w szeregu doświadczeń.

Zgodnie z tym modelem:

Ważnym problemem pozostaje wyjaśnienie zagadnienia stabilności takiego atomu. Elektrony nie mogą być nieruchome bo w wyniku przyciągania z dodatnim jądrem zostałyby do niego przyciągnięte i wtedy „wrócilibyśmy” do modelu Thomsona. Jeżeli dopuścimy ruch elektronów wokół jądra (tak jak planety wokół Słońca w układzie słonecznym) to też natrafiamy na trudność interpretacyjną. Krążący elektron doznaje stale przyspieszenia (dośrodkowego) i zgodnie z elektrodynamiką klasyczną wysyła energię kosztem swojej energii mechanicznej. Oznaczałoby to, że poruszałby się po spirali ostatecznie spadając na jądro (model Thomsona).

Problem stabilności atomów doprowadził do powstania nowego modelu zaproponowanego przez N. Bohra. Podstawową cechą tego modelu było to, że umożliwiał przewidywanie widm promieniowania wysyłanego przez atomy.

Najpierw omówimy więc podstawowe cechy tych widm.

Widma atomowe

Na rysunku przedstawiony jest typowy układ do pomiaru widm atomowych.

Źródłem promieniowania jest jednoatomowy gaz pobudzony do świecenia metodą wyładowania elektrycznego. Promieniowanie przechodzi przez szczelinę kolimującą, a następnie pada na pryzmat (lub siatkę dyfrakcyjną), który rozkłada promieniowanie na składowe o różnych długościach fal.

Na kliszy fotograficznej uwidacznia się cecha szczególna obserwowanych widm. W przeciwieństwie do widma ciągłego emitowanego np. przez powierzchnie ciał ogrzanych do wysokich temperatur, promieniowanie wysyłane przez swobodne atomy zawiera tylko pewną liczbę długości fal. Każda z takich składowych długości fal nazywana jest linią (bo taki jest obraz szczeliny).

Na rysunku na następnej stronie pokazana jest widzialna część widma atomu wodoru.

To właśnie badanie widma wodoru doprowadziło Bohra do sformułowania nowego modelu atomu. Model ten chociaż posiada pewne braki to ilustruje idę kwantowania w sposób prosty matematycznie.

Model Bohra atomu wodoru

Jak już mówiliśmy fizyka klasyczna przewidywała, że atom krążący po orbicie będzie wypromieniowywał energię, tak że częstość elektronu a za tym także częstość wysyłanego promieniowania będzie się zmieniać w sposób ciągły. Tymczasem obserwujemy bardzo ostre linie widmowe o ściśle określonej częstotliwości (długości fali).

Bohr uniknął tej trudności zakładając, że podobnie jak oscylatory Plancka, tak samo atom wodoru może znajdować się w ściśle określonych stanach energetycznych, w których nie wypromieniowuje energii. Emisja następuje tylko wtedy gdy atom przechodzi z jednego stanu o energii Ek do stanu o niższej energii Ej. Ujmując to w postaci równania

Ek – Ej = hv (33.1)

gdzie hv oznacza kwant energii niesionej przez foton, który zostaje w trakcie przejścia wypromieniowany przez atom.

Teraz konieczna jest znajomość energii stanów stacjonarnych i wtedy obliczając możliwe różnice energii będziemy mogli przewidzieć wygląd widma promieniowania emitowanego przez atom.

Założenia:

Korzystając z drugiej zasady Newtona i prawa Coulomba otrzymujemy

F = ma

albo

(33.2)

Uwzględniliśmy tylko przyciąganie elektrostatyczne pomiędzy dodatnim jądrem i ujemnym elektronem zaniedbując oddziaływanie grawitacyjne. Czy słusznie?

Przykład 1

Obliczyć stosunek sił przyciągania grawitacyjnego do elektrostatycznego dla protonu i elektronu w atomie wodoru. Masa elektronu me = 9.1·10-31 kg, masa protonu mp = 1.7·10-27 kg, ładunek elementarny e = 1.6·10-19 C stała grawitacyjna G = 6.67·10-11 Nm2/kg2, a stała w prawie Coulomba 1/4πε0 = 8.99·109 Nm2/C2.

Siła grawitacyjna jest całkowicie do zaniedbania.

Wzór (33.2) pozwala obliczyć energię kinetyczną

(33.3)

Energia potencjalna układu elektron - proton jest dana równaniem

(33.4)

Całkowita energia układu wynosi

(33.5)

Ponieważ, promień orbity może przyjmować dowolną wartość więc i energia też może być dowolna. Ze wzoru (33.3) możemy wyznaczyć prędkość liniową elektronu

a następnie częstotliwość

Pęd dany jest równaniem

a moment pędu

(33.6)

Tak więc, jeżeli jest dane r, to znane są również parametry orbitalne: Ek, Ep, E, v, v0, p, oraz L.

Jeżeli jakakolwiek z tych wielkości jest skwantowana, to wszystkie muszą być skwantowane.

Na tym etapie Bohr nie miał żadnych zasad, którymi mógłby się posłużyć.

W związku z tym wysunął hipotezę, według której najprostszą jest kwantyzacja parametrów orbity i zastosował ją do momentu pędu L.

Postulaty Bohra były następujące:

  1. Elektron w atomie porusza się po orbicie kołowej pod wpływem przyciągania kulombowskiego pomiędzy elektronem i jądrem i ruch ten podlega prawom mechaniki klasycznej.

  2. Zamiast nieskończonej liczby orbit dozwolonych z punktu widzenia mechaniki klasycznej, elektron może poruszać się tylko po takich orbitach, dla których moment pędu L jest równy całkowitej wielokrotności stałej Plancka podzielonej przez 2π.

(33.7)

gdzie stała n oznacza liczbę kwantową. (Zwróćmy uwagę, że ponownie tak jak przy opisie ciała doskonale czarnego, efektu fotoelektrycznego, efektu Comptona, pojawia się stała Plancka h.)

  1. Pomimo, że elektron doznaje przyspieszenia (poruszając się po takiej orbicie), to jednak nie wypromieniowuje energii. A zatem jego całkowita energia pozostaje stała.

  2. Promieniowanie elektromagnetyczne zostaje tylko wysłane gdy elektron poruszający się po orbicie o całkowitej energii Ej zmienia swój ruch skokowo, tak że porusza się następnie po orbicie o energii Ek. Częstotliwość emitowanego promieniowania jest równa

(33.8)

Uwaga: To jest postulat Einsteina głoszący, że częstotliwość fotonu promieniowania elektromagnetycznego jest równa energii fotonu podzielonej przez stałą Plancka.

Drugi postulat opisuje kwantyzację momentu pędu L. Ale jak już mówiliśmy jeżeli jakakolwiek z wielkości: Ek, Ep, E, v, v0, p, i L jest skwantowana, to wszystkie muszą być skwantowane.

Łącząc równanie (33.6) z postulatem Bohra dla L, otrzymujemy

(33.9)

Widzimy jak skwantowane jest r. Podstawienie tego równanie do wyrażenia na energię całkowitą (33.5) daje

(33.10)

Z tego równania otrzymujemy wartości energii dozwolonych stanów stacjonarych.

Stan n = ∞ odpowiada stanowi E = 0, w którym elektron jest całkowicie usunięty poza atom.

Na rysunku poniżej są pokazane wybrane przeskoki między różnymi stanami stacjonarnymi.

Długość każdej ze strzałek jest równa różnicy energii między dwoma stanami stacjonarnymi czyli równa energii hv wypromieniowanego kwantu. Częstotliwość emitowanego promieniowania można obliczyć korzystając z postulatu Bohra dotyczącego częstotliwości promieniowania emitowanego przez atom oraz ze wzoru na energię (33.7)

(33.11)

gdzie j, k są liczbami kwantowymi opisującymi niższy i wyższy stan stacjonarny.

Na gruncie modelu Bohra można łatwo zrozumieć własności widm emisyjnych atomów jednoelektronowych. Można również zrozumieć widma absorpcyjne. Ponieważ elektron musi mieć w atomie energię całkowitą równą jednej z energii dozwolonych (stanu stacjonarnego) więc z padającego promieniowania może on absorbować tylko określone porcje (kwanty) energii. Energia absorbowanych kwantów hv musi być równa różnicy pomiędzy energiami dozwolonych stanów tak więc linie widma absorpcyjnego mają te same częstotliwości (długości fal) co linie widma emisyjnego.

Na początku atom jest w stanie podstawowym n = 1 więc procesy absorpcji odpowiadają serii Lymana. W bardzo wysokich temperaturach atomy będą już w stanie n = 2 i możemy obserwować linie absorpcyjne serii Balmera (widzialne).

Wykład 34

Fale i cząstki

Fale materii

Omawiane na poprzednich wykładach doświadczenia były interpretowane raz w oparciu o obraz falowy (np. dyfrakcja) innym razem w oparciu o model cząsteczkowy (np. efekt Comptona).

Jeżeli światło ma dwoistą falowo-cząsteczkową naturę, to być może materia też ma taką dwoistą naturę. Taką sugestię zaprezentował w 1924 L. de Broglie min. w oparciu obserwację, że Wszechświat składa się wyłącznie ze światła i materii oraz że pod wieloma względami przyroda jest zadziwiająco symetryczna. Chociaż materię traktowano jako cząstki de Broglie zasugerował, że należy zbadać czy materia nie wykazuje również własności falowych.

De Broglie nie tylko zaproponował istnienie fal materii ale również przewidział ich długość. Założył, że długość przewidywanych fal materii jest określona tym samym związkiem, który stosuje się do światła.

Analizując zderzenie fotonu z elektronem (efekt Comptona) zastosowano do tego zderzenia zasadę zachowania pędu. Do tych obliczeń potrzebne było wyrażenie na pęd fotonu.

(34.1)

Analogiczne wyrażenie zostało zaproponowane przez de Broglia dla fal materii

(34.2)

Wyrażenie to wiąże teraz pęd cząstki materialnej z długością przewidywanych fal materii.

Przykład 1

Jaką długość fali przewiduje równanie (34.2) dla obiektów „masywnych” np. dla piłki, o masie 1 kg, poruszającej się z prędkością 10 m/s, a jaką dla „lekkich” np. elektronów przyspieszonych napięciem 100 V?

Dla piłki p= mv = 1 kg·10 m/s = 10 kg m/s

Stąd długość fali de Broglie’a

Ta wielkość jest praktycznie równa zeru zwłaszcza w porównaniu z rozmiarami obiektu. Doświadczenia prowadzone na takim obiekcie nie pozwalają więc na rozstrzygnięcie czy materia wykazuje własności falowe (λ zbyt mała). Przypomnijmy, że falowy charakter światła przejawia się gdy wymiary liniowe obiektów są porównywalne z długością fali.

Natomiast elektrony przyspieszone napięciem 100 V uzyskują energię kinetyczną

Ek = eU = 100 eV = 1.6·10-17 J

Prędkość jaką uzyskują elektrony wynosi

Odpowiednia długość fali de Broglie’a wynosi

Jest to wielkość rzędu odległości między atomowych w ciałach stałych.

Można więc zbadać falową naturę materii (tak jak promieni Roentgena) skierowując wiązkę elektronów, o odpowiedniej energii, na kryształ. Takie doświadczenie przeprowadzili w 1961 roku Davisson i Germer w USA oraz Thomson w Szkocji. Na rysunku przedstawiono schemat aparatury pomiarowej.

Elektrony emitowane z ogrzewanego włókna przyspieszane są regulowanym napięciem. Wiązka zostaje skierowana na kryształ niklu a detektor jest ustawiony pod pewnym szczególnym kątem ϕ. Natężenie wiązki ugiętej na krysztale jest odczytywane przy różnych napięciach przyspieszających. Okazuje się, że prąd w detektorze ujawnia maksimum dyfrakcyjne przy kącie równym 50° dla U = 54 V.

Jeżeli skorzystamy z prawa Bragga możemy obliczymy wartość λ, dla której obserwujemy maksimum w tych warunkach

Dla niklu d = 0.091 nm. Ponieważ ϕ = 50° więc θ = 90° - ϕ/2 = 65° (rysunek).

Długość fali obliczona w oparciu o te dane wynosi:

λ = 2·0.091 nm·sin65° = 0.165 nm

Teraz w oparciu o znaną energię elektronów (54 eV) obliczymy długość fali de Broglie’a analogicznie jak w przykładzie 1

Ta doskonała zgodność stanowiła argument za tym, że w pewnych okolicznościach elektrony wykazują naturę falową.

Dzisiaj wiemy, że inne cząstki, zarówno naładowane jak i nienaładowane, wykazują cechy charakterystyczne dla fal. Dyfrakcja neutronów jest powszechnie stosowaną techniką eksperymentalną używaną do badania struktury ciał stałych.

Tak więc, zarówno dla materii, jak i dla światła, musimy przyjąć istnienie dwoistego ich charakteru.

Struktura atomu i fale stojące

Jeżeli na ruch fali nie ma żadnych ograniczeń to fala może mieć dowolną długość. Inaczej sytuacja przedstawia się gdy ruch fal zostanie ograniczony przez nałożenie pewnych warunków fizycznych. Np. dla fal w strunie odpowiada to wyodrębnieniu odcinka struny zamocowanego na obu końcach (np. struna w skrzypcach).

Występują wtedy dwie ważne różnice:

Na rysunku widać trzy pierwsze stany kwantowe dla drgającej struny.

Jeżeli więc ruch elektronów jest ograniczony w atomach to możemy się spodziewać przez analogię, że:

Rysunek poniżej przedstawia stojącą falę materii związaną z orbitą o promieniu r. Długość fali de Broglie’a została dobrana tak, aby orbita o promieniu r zawierała całkowitą liczbę n fal materii.

Wtedy otrzymujemy

czyli

Prowadzi to natychmiast do

Warunek kwantyzacji Bohra jest teraz konsekwencją przyjęcia, że elektron jest reprezentowany przez odpowiednią falę materii i zastosowania odpowiednich warunków brzegowych.

Mechanika falowa

W 1926 roku E. Schrödinger sformułował mechanikę falową (jedno ze sformułowań fizyki kwantowej) min. w oparciu o założenie, że stacjonarne stany w atomach odpowiadają stojącym falom materii.

Dla fal w strunie zaburzenie może być opisane za pomocą poprzecznego wychylenia y, dla fal elektromagnetycznych poprzez wektor natężenia pola elektrycznego E.

Analogiczną miarą dla fal materii jest funkcja falowa ψ.

Teraz spróbujemy znaleźć taką funkcję dla prostego zagadnienia ruchu cząstki o masie m pomiędzy sztywnymi ściankami odległymi o l.

Funkcję falową można otrzymać przez analogię do zagadnienia struny umocowanej na obu końcach. Z warunków brzegowych wynika, że na obu końcach struny muszą występować węzły. Oznacza to (przez to żądanie) że długość fali jest skwantowana:

Zaburzenie falowe dla struny jest opisane przez falę stojącą (Wykład 15)

y(x,t) = 2Asinkxcosωt

dla której rozkład przestrzenny (amplitudy) jest dany przez

y(x) = Asinkx

gdzie k = 2π/λ. Ponieważ λ jest skwantowane to k też jest skwantowane.

Prowadzi to do warunku

Wykres tej funkcji dla n =1, 2, 3 pokazany jest na stronie 34-4.

Rozważmy teraz cząstkę poruszającą się pomiędzy sztywnymi ściankami (rysunek na następnej stronie)

Ponieważ ścianki są sztywne, cząstka nie może przeniknąć przez nie, tak więc stojąca fala materii opisująca tę cząstkę ma węzły na ściankach. Inaczej mówiąc funkcja falowa ψ przyjmuje wartość zero w punktach x = 0 i x = l.

W konsekwencji dopuszczalne fale materii muszą mieć długość fal danych równaniem

Ponieważ mówimy o fali materii (reprezentującej cząstkę) to jest to po prostu fala de Broglie’a, dla której możemy zastąpić λ przez h/p.

Prowadzi to do związku

Widzimy, że pęd cząstki uwięzionej pomiędzy ściankami jest skwantowany.

Dla cząstki pęd p jest związany z energią kinetyczną Ek relacją

Zestawienie tego równania z równaniem na pęd cząstki prowadzi do warunku kwantyzacji energii

Cząstka nie może mieć dowolnej energii (jak w obrazie klasycznym) ale ściśle określone wartości dane powyższym równaniem.

Amplituda fal materii zmienia się tak samo jak amplituda dla fali stojącej w strunie tzn. jest dana analogicznym równaniem:

(34.3)

Znaczenie funkcji ψ

Funkcję ψ skonstruowaliśmy przez analogię do funkcji opisującej amplitudę fali stojącej w strunie. Ale nie wyjaśniony jest jeszcze sposób w jaki ψ przedstawia ruch cząstki. Wiemy już, że długość fali materii (de Broglie’a) wiąże się bezpośrednio z pędem cząstki. Pozostaje wyjaśnić z czym wiąże się ψ.

Jako pierwszy fizyczną interpretację funkcji falowej podał Max Born. Zasugerował, że wielkość ψ2 w dowolnym punkcie przedstawia miarę prawdopodobieństwa, że cząstka znajdzie się w pobliżu tego punktu tzn. w jakimś obszarze wokół tego punktu np. w przedziale x, x+dx.

Ta interpretacja funkcji ψ daje statystyczny związek pomiędzy falą i związaną z nią cząstką. Nie mówimy gdzie cząstka jest ale gdzie prawdopodobnie się znajdzie.

Tak więc dla cząstki poruszającej się pomiędzy dwoma ściankami odległymi o l

(34.4)

nie opisuje położenia cząstki ale rozkład (gęstość) prawdopodobieństwa.

Na rysunku przedstawiona jest zależność ψ2(x) dla trzech pierwszych stanów ruchu cząstki.

Zwróćmy uwagę, że przykładowo dla n = 1 cząsteczka ma większą tendencję (prawdopodobieństwo) do przebywania w środku niż przy ściankach. Jest to sprzeczne z fizyką klasyczną, która przewiduje jednakowe prawdopodobieństwo przebywania cząstki gdziekolwiek pomiędzy ściankami (linie poziome na rysunku). Podobnie jest dla wyższych n. Oczywiście całkowite prawdopodobieństwo znalezienia cząstki pomiędzy ściankami jest równe jedności.

Zagadnienie cząstki poruszającej się pomiędzy sztywnymi ściankami ma mało realne zastosowanie w fizyce. Dlatego poniżej pokazane są wyniki zastosowania mechaniki falowej do problemu atomu wodoru.

Sam problem jest trudny matematycznie. Dlatego pokazane są tylko wyniki zależności ψ(r) dla n = 1, 2, 3 dla orbitalnej liczby kwantowej l = 0, (rozkład sferycznie symetryczny).

Widać, że mamy ponownie do czynienia z rozkładem prawdopodobieństwa. Istnieje obszar w którym elektron może przebywać (z niezerowym prawdopodobieństwem). Mówimy o orbitalach zamiast o orbitach.

Linią przerywaną zaznaczono promienie orbit przewidywane w modelu Bohra.

Są, jak widać orbity dla których ta wartość odpowiada maksimum prawdopodobieństwa znalezienia elektronu.

Zasada odpowiedniości

Chociaż teorie w fizyce mają ograniczenia to zazwyczaj w sposób ciągły dają wyniki coraz mniej zgodne od doświadczenia, tzn. nie „urywają” się nagle.

Np. mechanika Newtonowska staje się coraz mniej dokładna gdy prędkość zbliża się do prędkości światła.

Dla mechaniki kwantowej też istnieje taka granica. Fizyka kwantowa przechodzi w fizykę klasyczną dla dużych liczb kwantowych. To twierdzenie nazywamy zasadą odpowiedniości.

W przykładzie z wykładu 31 widzieliśmy, że dla makroskopowego wahadła nie uwidacznia się natura kwantowa podobnie jak w układach makroskopowych nie widzimy dyskretnej natury materii (cząsteczek, atomów, elektronów itp.).

Wyliczona wtedy względna zmiana energii wyniosła

ΔE/E = 4.7·10-31 = hv/nhv

Stąd otrzymujemy bardzo dużą wartość liczby kwantowej n ≈ 2·1030; możemy stosować mechanikę klasyczną.

Zasada nieoznaczoności

W poprzednim paragrafie najbardziej szczegółową informacją jaką udało się uzyskać o ruchu elektronów były krzywe prawdopodobieństwa. Czy musimy zadowolić się taką informacją czy też jest możliwy pomiar, który da nam odpowiedź na temat ewentualnych orbit po których poruszają się elektrony?

Obserwacje przedmiotów opierają się na rejestrowaniu światła odbitego przez te przedmioty. Światło w „zderzeniu” z przedmiotem o dużej masie praktycznie nie zaburza jego ruchu, ale całkiem inną sytuację mamy w przypadku elektronów. Tutaj też spodziewamy się, że zobaczymy elektron gdy odbijemy od niego światło (tak jak widzimy np. stół rejestrując światło odbite od niego). W tym jednak przypadku elektron w zderzeniu z fotonem dozna odrzutu, który całkowicie zmieni jego ruch (przypomnijmy sobie efekt Comptona). Zmiany tej nie można uniknąć ani dokładnie ocenić. Gdyby więc istniały orbity to byłyby one całkowicie niszczone przy próbie pomiarów mających potwierdzić ich istnienie. Dlatego wolimy mówić o prawdopodobieństwie niż o orbitach.

Aby przetestować nasze możliwości pomiarowe rozważmy wiązkę elektronów padających z prędkością v0 na szczelinę o szerokości Δy, tak jak na rysunku.

Jeżeli elektron przechodzi przez otwór to znamy jego położenie z dokładnością Δx. Elektrony ulegają ugięciu na szczelinie tak, że na ekranie obserwujemy obraz dyfrakcyjny. Oznacza to, że elektrony mają teraz oprócz prędkości poziomej także składową w kierunku y (są odchylone). Spróbujmy ocenić tę składową pionową prędkości. Rozpatrzmy np. elektron padający na ekran w miejscu pierwszego minimum dyfrakcyjnego (punkt a na rysunku poniżej). Pierwsze minimum jest dane równaniem

Δysinθ = λ

a dla małego kąta

Δy θλ

Aby elektron doleciał do punkt a (1-sze minimum) musi mieć prędkość pionową Δvy taką, że

Korzystając z obu powyższych równań otrzymujemy

lub inaczej

ΔvyΔy = λv0

Długość fali wiązki elektronowej jest dana przez h/p czyli h/mv0. Podstawiając to do ostatniego równania otrzymujemy

co można zapisać

ΔpyΔyh

Jeżeli chcemy poprawić pomiar y (zmniejszyć Δy) to w wyniku zmniejszenia szerokości szczeliny otrzymujemy szersze widmo dyfrakcyjne (mocniejsze ugięcie). Inaczej mówiąc zwiększone zostało Δpy. Równani to przedstawia ograniczenie nałożone na dokładność pomiarów przez przyrodę (nie ma nic wspólnego z wadami aparatury pomiarowej).

Równanie to jest szczególnym przypadkiem ogólnej zasady podanej przez W. Heisenberga znanej jako zasada nieoznaczoności.

W zastosowaniu do pomiaru pędu i położenia głosi ona, że

(34.5)

Tak więc żadna składowa ruchu elektronu nie może być określona z nieograniczoną dokładnością. Ta sama zasada obowiązuje w odniesieniu do energii i czasu.

Wykład 35

Lasery

Emisja spontaniczna

Jeden z postulatów Bohra mówił, że promieniowanie elektromagnetyczne zostaje wysłane tylko wtedy gdy elektron poruszający się po orbicie o całkowitej energii Ej zmienia swój ruch skokowo, tak że porusza się następnie po orbicie o energii Ek. W języku mechaniki kwantowej mówimy, że cząstka (elektron) przechodzi ze stanu wzbudzonego (o wyższej energii) do stanu podstawowego emitując foton. Częstotliwość emitowanego promieniowania jest równa

Jak już widzieliśmy źródłem takiego promieniowania jest na przykład jednoatomowy gaz pobudzony do świecenia metodą wyładowania elektrycznego (widmo liniowe).

Teoria kwantowa przewiduje, że elektron znajdujący się w stanie wzbudzonym samoistnie przejdzie do stanu podstawowego emitując foton. Zjawisko takie jest nazywane emisją spontaniczną.

Jeżeli różnica energii wynosi kilka elektronowoltów (jak w atomie wodoru, gdzie E1 = ‑13.6 eV) to czas charakterystyczny dla procesu emisji spontanicznej ma wartość rzędu 10-8 s.

Absorpcja

Na gruncie modelu Bohra można łatwo zrozumieć własności widm emisyjnych atomów jednoelektronowych. Można również zrozumieć widma absorpcyjne.

Ponieważ elektron musi mieć w atomie energię całkowitą równą jednej z energii dozwolonych (stanu stacjonarnego) więc z padającego promieniowania może on absorbować tylko określone porcje (kwanty) energii. Energia absorbowanych kwantów hν musi być równa różnicy pomiędzy energiami dozwolonych stanów tak więc linie widma absorpcyjnego mają te same częstotliwości (długości fal) co linie widma emisyjnego.

Doświadczenie pokazuje, że w chłodnym gazie atomy są w stanie podstawowym n = 1 więc procesy absorpcji odpowiadają serii Lymana. W bardzo wysokich temperaturach atomy będą już w stanie n = 2 i możemy obserwować linie absorpcyjne serii Balmera (widzialne).

Procesy wzbudzania atomów na wyższe poziomy energetyczne przez ich oświetlanie nosi nazwę pompowania optycznego.

Emisja wymuszona

Teoria kwantowa mówi także, że oprócz emisji spontanicznej oraz procesów absorpcji występuje także inny proces, nazywany emisją wymuszoną.

Przypuśćmy, że atom znajduje się w stanie wzbudzonym Ej i może emitować foton o energii (Ej - Ek). Jeżeli taki atom zostanie oświetlony promieniowaniem, które zawiera fotony o energii właśnie równej (Ej - Ek) to prawdopodobieństwo wypromieniowania przez atom energii wzrośnie.

Takie zjawisko przyspieszenia wypromieniowania energii przez oświetlenie atomów wzbudzonych odpowiednim promieniowaniem nazywane jest emisją wymuszoną.

Uwaga: Foton wysyłany w procesie emisji wymuszonej ma taką samą fazę oraz taki sam kierunek ruchu jak foton wymuszający.

W emisji spontanicznej mamy do czynienia z fotonami, których fazy i kierunki są rozłożone przypadkowo. Emisja wymuszona stwarza szansę uzyskania promieniowania spójnego.

Żeby móc przeanalizować możliwość takiej emisji musi wiedzieć jak atomy (cząsteczki) układu obsadzają różne stany energetyczne tzn. ile jest w stanie podstawowym a ile w stanach wzbudzonych.

Rozkład Boltzmana

Opis szczegółowy układu fizycznego złożonego z bardzo dużej liczby elementów jest bardzo skomplikowany np. próba opisu ruchu jednej cząstki gazu w układzie zawierającym 1023 cząstek (1 mol).

Na szczęście do wyznaczenia podstawowych własności układu (wielkości mierzalnych) takich jak temperatura, ciśnienie - informacje szczegółowe są na ogół niepotrzebne.

Jeśli do układu wielu cząstek zastosujemy ogólne zasady mechaniki (takie jak prawa zachowania) to możemy zaniedbać szczegóły ruchu czy oddziaływań pojedynczych cząstek i podstawowe własności układu wyprowadzić z samych rozważań statystycznych.

Taki przykład już poznaliśmy. Jest nim związek pomiędzy własnościami gazu klasycznego i rozkładem Maxwella prędkości cząsteczek gazu.

Funkcja rozkładu N(v) daje informację o prawdopodobieństwie, że cząsteczka ma prędkość w przedziale v, v + d v. Znając funkcję N(v) możemy obliczyć takie wielkości jak średnia prędkość (pęd niesiony przez cząsteczki), średni kwadrat prędkości (energia kinetyczna) itp. a na ich podstawie obliczyć takie wielkości mierzalne jak ciśnienie (związane z pędem) czy temperaturę (związaną z energią).

Spróbujemy teraz znaleźć rozkład prawdopodobieństwa z jakim cząstki układu zajmują różne stany energetyczne.

W tym celu rozpatrzymy układ zawierający dużą liczbę cząstek, które znajdują się w równowadze w temperaturze T. By osiągnąć ten stan równowagi cząstki muszą wymieniać energię ze sobą (poprzez zderzenia). Podczas tej wymiany ich energie będą fluktuować, przyjmując wartości raz mniejsze raz większe od średniej.

Żeby to zilustrować rozważmy układ, w którym cząstki mogą przyjmować jedną z następujących wartości energii E = 0, ΔE, 2ΔE, 3ΔE, 4ΔE..... .

Celem uproszczenia przyjmijmy, że układ ma zawiera tylko 4 cząstki oraz, że energia całkowita układu ma wartość 3ΔE.

Ponieważ te cztery cząstki mogą wymieniać energię między sobą, więc realizowany może być każdy możliwy podział energii całkowitej 3ΔE pomiędzy te obiekty. Na rysunku poniżej pokazane są wszystkie możliwe podziały, które numerujemy indeksem i.

Uwaga: Obliczając ilość sposobów realizacji danego podziału traktujemy jako rozróżnialny podział, który można otrzymać z danego w drodze przestawiania cząstek pomiędzy różnymi stanami. Przestawienia cząstek w tym samym stanie energetycznym nie prowadzą do nowych sposobów realizacji podziałów, bo nie można eksperymentalnie odróżnić od siebie takich samych cząstek o tej samej energii. Wreszcie ostatnie założenie: wszystkie sposoby podziału energii mogą wydarzyć się z tym samym prawdopodobieństwem.

i E=0 EE E=2ΔE E=3ΔE E=4ΔE liczba sposobów realizacji podziału Pi
1 1,2,3 4
1 1,2,4 3 4 4/20
1 1,3,4 2
1 2,3,4 1
2 1,2 3 4
2 1,2 4 3
2 1,3 2 4
2 1,3 4 2
2 1,4 2 3
2 1,4 3 2 12 12/20
2 2,3 1 4
2 2,3 4 1
2 2,4 1 3
2 2,4 3 1
2 3,4 1 2
2 3,4 2 1
3 1 2,3,4
3 2 1,3,4 4 4/20
3 3 1,2,4
3 4 1,2,3
n(E) 40/20 24/20 12/20 4/20 0/20

Obliczamy następnie n(E) czyli prawdopodobną ilość cząstek w danym stanie energetycznym E.

Weźmy stan E = 0.

Dla podziału i = 1 mamy 3 cząstki a prawdopodobieństwo, że taki podział ma miejsce wynosi 4/20.

Dla podziału i = 2 mamy 2 cząstki a prawdopodobieństwo, że taki podział ma miejsce wynosi 12/20.

Wreszcie dla podziału i = 3 mamy 1 cząstkę a prawdopodobieństwo, że taki podział ma miejsce wynosi 4/20.

Zatem prawdopodobna ilość obiektów w stanie E = 0 wynosi:

n(E) = 3 (4/20) + 2 (12/20) + 1 (4/20) = 40/20 = 2

Analogicznie obliczamy n(E) dla pozostałych wartości E (patrz ostatni wiersz tabeli).

Zauważmy, że suma tych liczb wynosi cztery, tak że jest równa całkowitej liczbie cząstek we wszystkich stanach energetycznych.

Wykres zależności n(E) jest pokazany na rysunku poniżej.

Ciągła krzywa na rysunku jest wykresem malejącej wykładniczo funkcji

(35.1)

Możemy teraz brać ΔE coraz mniejsze (zwiększając ilość dozwolonych stanów) przy tej samej co poprzednio wartości całkowitej energii. Oznacza to, że będziemy dodawać coraz więcej punktów do naszego wykresu, aż w granicy gdy ΔE → 0 przejdziemy do funkcji ciągłej danej powyższym równaniem.

Potrzebujemy jeszcze znaleźć E0. Obliczenia te choć proste wykraczają poza ramy tego wykładu. Wystarczy więc zapamiętać, że E0 = kT, tzn. jest równa średniej energii układu cząstek w temperaturze T.

Ostatecznie więc

(35.2)

Jest to rozkład Boltzmana, który mówi, że prawdopodobna ilość cząstek układu w równowadze w temperaturze T, znajdujących się w stanie o energii E jest proporcjonalna do . Sposób wyboru stałej proporcjonalności A zależy od tego jaki układ rozważamy. Poniżej pokazana jest zależność n(E) dla trzech różnych temperatur i trzech odpowiednich wartości stałej A.

Widzimy, że stany o niższej energii są obsadzane z większym prawdopodobieństwem niż stany o wyższym E.

Laser

Jeżeli więc układ będący w stanie równowagi oświetlimy odpowiednim promieniowaniem to w takim układzie absorpcja będzie przeważała nad emisją wymuszoną.

Żeby przeważała emisja wymuszona, to w wyższym stanie energetycznym musi się znajdować więcej atomów (cząsteczek) niż w stanie niższym. Mówimy, że rozkład musi być antyboltzmanowski.

Taki układ można przygotować na kilka sposobów min. za pomocą zderzeń z innymi atomami lub za pomocą pompowania optycznego.

Ten pierwszy sposób jest wykorzystywany w laserze helowo-neonowym.

Schemat poziomów energetycznych dla tego lasera jest pokazany na rysunku poniżej.

W tym laserze atomy neonu są wzbudzane do na poziom En w trakcie zderzeń ze wzbudzonymi atomami helu. Przejście na poziom En zachodzi wskutek emisji wymuszonej. Następnie atomy neonu przechodzą szybko do stanu podstawowego oddając energię w wyniku zderzeń ze ściankami. Emisja wymuszona w laserze przedstawiona została na rysunkach poniżej.

Na rysunku (a) foton zostaje „wprowadzony” do gazu. Foton wymusza emisję drugiego fotonu przez wzbudzony atom (b). Przez układ poruszają się dwa fotony. Wymuszona zostaje kolejna emisja i już trzy fotony o tej samej fazie poruszają się przez układ (c). Jeżeli na końcach zbiornika znajdują się lustra to ten proces będzie trwał aż wszystkie atomy wypromieniują nadmiar energii. Jeżeli jedno z tych zwierciadeł będzie częściowo przepuszczające to układ będzie opuszczała wiązka spójna - wszystkie fotony będą miały tę samą fazę.

Inny sposób „odwrócenia” rozkładu boltzmanowskiego jest wykorzystany w laserze rubinowym. Laser zbudowany na ciele stałym składa się z pręta wykonanego z kryształu Al2O3, w którym jonami czynnymi są jony z grupy ziem rzadkich. Na końcach pręta są naniesione zwierciadła odbijające. Promieniowanie pompujące jest wytwarzane przez lampę błyskową umieszczoną wokół kryształu tak jak pokazano na rysunku poniżej.

Od czasu uruchomienia pierwszego lasera tj. od 1960 roku technologia tych urządzeń bardzo się rozwinęła. Obecnie działają zarówno lasery impulsowe jak i lasery o pracy ciągłej. Ośrodkami czynnymi w laserach są gazy, ciała stałe i ciecze, a zakres długości fal jest bardzo szeroki; od podczerwieni przez obszar widzialny aż do nadfioletu (ostatnio !!!).

Zastosowania laserów są wszechstronne. Przykładowo:

Wykład 36

Atomy wieloelektronowe, układ okresowy pierwiastków.

Fizycy badający strukturę atomów wieloelektronowych starali się odpowiedzieć na fundamentalne pytanie, dlaczego wszystkie elektrony w atomie znajdującym się w stanie podstawowym nie są związane na najbardziej wewnętrznej powłoce (orbicie).

Fizyka klasyczna nie wyjaśnia tego problemu; dopiero mechanika kwantowa przyniosła podstawy teoretyczne, na gruncie których można przewidzieć własności pierwiastków.

Liczby kwantowe

Na poprzednich wykładach przedstawione zostało wprowadzenie do świata fizyki kwantowej. Poznaliśmy między innymi jak ograniczenie ruchu cząstki do obszaru zawartego pomiędzy sztywnymi ściankami wpływa na prawdopodobieństwo jej znalezienia oraz jak wpływa na skwantowanie wartości energii

Podobnie wartości energii elektronu w atomie wodoru zależą tylko od liczby kwantowej n.

Inaczej jednak jest w przypadku odpowiedniej fali (stojącej) materii. Funkcja falowa zależy od trzech liczb kwantowych co wynika z faktu, że ruch w przestrzeni jest opisany przez trzy niezależne zmienne; na każdą współrzędną przestrzenną przypada jedna liczba. Na rysunku obok pokazane są współrzędne prostokątne (x, y, z) i współrzędne sferyczne (r, θ, ϕ) punktu P.

Stosowanie współrzędnych sferycznych w zdecydowany sposób ułatwia obliczenia. Wynika to z faktu, że energia potencjalna oddziaływania elektronu z jądrem jest funkcją tylko jednej zmiennej we współrzędnych sferycznych podczas gdy we współrzędnych prostokątnych funkcją wszystkich trzech współrzędnych

Trzy liczby kwantowe n, l, ml spełniają następujące warunki

(36.1)

Ze względu na rolę jaką odgrywa liczba n w określeniu energii całkowitej atomu, jest nazywana główną liczbą kwantową. Liczba l nosi nazwę azymutalnej liczby kwantowej, a liczba ml nazywana jest magnetyczną liczbą kwantową. Z warunków (36.1) widać, że dla danej wartości n (danej energii) istnieje na ogół kilka różnych możliwych wartości l, ml.

Zasada Pauliego

W 1869 r. Mendelejew jako pierwszy zauważył, że większość własności pierwiastków chemicznych jest okresową funkcją liczby atomowej Z określającej liczbę elektronów w atomie co najlepiej uwidacznia się w odpowiednio skonstruowanym układzie okresowym pierwiastków. Właściwości chemiczne i fizyczne pierwiastków powtarzają się jeżeli zebrać je w grupy zawierające 2, 8, 8, 18, 18, 32 elementów.

W 1925 r. Wolfgang Pauli podał prostą zasadę, dzięki której automatycznie są generowane grupy o liczebności 2, 8,18,32. Pauli zapostulował, że na jednej orbicie mogą znajdować się nie więcej niż dwa elektrony, czyli tylko dwa elektrony mogą być opisane tą samą falą stojącą materii.

Zatem na orbicie n = 1 będą dwa elektrony bo mamy tylko jedną falę stojącą, czyli jeden orbital

(n, l, ml) = (1,0,0)

Dla n = 2 są cztery orbitale

(n, l, ml) = (2,0,0);

(2,1,1), (2,1,0), (2,1,–1)

Stąd wynika, że w stanie n = 2 może być 8 elektronów (dwa na orbital).

Podobnie dla n = 3 mamy 9 orbitali czyli 18 elektronów

(n, l, ml) = (3,0,0);

(3,1,1), (3,1,0), (3,1,–1);

(3,2,2), (3,2,1), (3,2,0), (3,2,–1), (3,2,–2)

Widać, że okresy 2, 8, 18 są konsekwencja zasady Pauliego i teorii kwantowej, z której wynikają warunki (36.1).

W czasie gdy Pauli podał swoją zasadę była ona zasadą ad hoc, nie można było jej wyprowadzić w ramach istniejącej teorii. Pozostawało więc pytanie: dlaczego akurat dwa elektrony (a nie inna liczba) mogą być opisane tą samą falą stojącą?

Spin elektronu

W roku 1926 odkryto, że wszystkie elektrony mają wewnętrzny moment pędu Lwew = (1/2)(h/2π), który został nazwany spinowym momentem pędu.

Elektron zachowuje się tak, jakby był kulką wirującą wokół pewnej osi obrotu (analogicznie jak Ziemia obiegająca Słońce i obracająca się wokół swej osi).

Wewnętrzny moment pędu elektronu nigdy nie zwiększa się ani też nie maleje.

Okazało się ponadto, że dla danego stanu orbitalnego są możliwe dwa kierunki spinu. Mamy więc inny sposób wyrażenia zasady Pauliego. Oznacza to, że zasada Pauliego nie była postulatem wprowadzona ad hoc.

Znajomość spinu jest niezbędna do opisu stanu elektronu. Kiedy te stany są określone to zasada Pauliego, która w pierwotnym brzmieniu stwierdzała, że w danym stanie orbitalnym nie może być więcej elektronów niż dwa, oznacza teraz, że w danym stanie (z uwzględnieniem spinu) może znajdować się tylko jeden elektron.

Atomy wieloelektronowe, układ okresowy pierwiastków

Posługując się zasadą Pauliego można określić jakie stany w atomie będą obsadzane.

Rozpatrzmy np. jądro neonu Z = 10. Jeżeli w pobliżu jądra umieścimy jeden elektron to zajmie on orbital n = 1. Tak samo będzie z drugim elektronem (inny kierunek spinu). Te dwa elektrony zapełnią orbitę n = 1. Pozostałe 8 elektronów zapełni orbitę o n = 2, czyli cztery orbitale (l, ml) = (0,0), (1,1), (1,0), (1,–1). W ten sposób rozpatrzymy przewidywaną przez teorię kwantową strukturę niektórych pierwiastków.

Z = 1, Wodór

Jedyny elektron znajduje się w stanie n = 1, o energii E = – 13.6 eV. Tak więc energia wiązania czyli energia jonizacji atomu wodoru wynosi 13.6 eV. Oznacza to, że minimalne napięcie potrzebne do zjonizowania atomu wodoru wynosi 13.6 V. To minimalne napięcie nazywamy potencjałem jonizacyjnym.

Z = 2, Hel

Zacznijmy od jonu helu, He+, który składa się z jądra oraz jednego elektronu.

Mamy układ podobny do wodoru tylko inna jest siła elektrostatyczna działająca na elektron (większa o czynnik Z). Energia jest dana wzorem analogicznym jak w modelu Bohra

(36.2)

Ze względu na czynnik Z2 energia jonizacji He+ wynosi 4·13.6 eV = 54.4 eV.

Wartość ta zgadza się ze zmierzonym potencjałem jonizacji.

Jeżeli teraz dodamy drugi elektron na powłokę n = 1 to przez połowę czasu będzie on bliżej jądra niż pierwszy i będzie „czuł” ładunek jądra Z, a przez połowę czasu będzie dalej więc będzie „widział” jądro o ładunku Z i 1 elektron czyli „obiekt” o ładunku
(Z – 1). Prosta średnia arytmetyczna tych dwóch wartości daje efektywny ładunek
Zef
 = 1.5e jaki „czują” elektrony w atomie helu. Możemy teraz uogólnić wzór (36.2) do postaci

(36.3)

Na podstawie tak oszacowanego ładunku efektywnego otrzymujemy potencjał jonizacji równy około (1.5)2·13.6 V = 30 V.

W rzeczywistości elektrony nie tylko ekranują ładunek jądra ale też odpychają się nawzajem (dodatnia energia potencjalna), więc energia wiązania powinna być mniejsza. Wyznaczony doświadczalnie potencjał jonizacyjny helu wynosi 24.6 V i jest największy dla wszystkich pierwiastków. Żadna siła chemiczna nie może dostarczyć takiej energii, która jest potrzebna do utworzenia He+.

Gdybyśmy spróbowali utworzyć ujemny jon He- to dodatkowy elektron obsadzi powłokę n = 2 o dużo większym promieniu niż n = 1, na której są już dwa elektrony. Ładunek efektywny widziany przez ten elektron będzie więc równy zeru, nie działa żadna siła mogąca przytrzymać ten elektron. W rezultacie hel nie tworzy cząsteczek z żadnym pierwiastkiem. Hel i inne atomy o całkowicie wypełnionych powłokach są nazywane gazami szlachetnymi.

Z = 3, Lit

Dwukrotnie zjonizowany atom litu jest atomem wodoropodobnym przy czym energie trzeba pomnożyć przez czynnik Z2 = 9.

Jednokrotnie zjonizowany atom litu ma energie podobne do atomu helu ale
Zef ≈ (3 – 1/2) zamiast (2 – 1/2), jak dla helu.

Trzeci elektron znajduje się na powłoce n = 2. Dla niego ładunek efektywny musi być w pobliżu (trochę większy) jedności. Zatem należy oczekiwać, że potencjał jonizacji litu będzie nieco większy niż 13.6/n2 = 13.6/22 = 3.4 V. Wartość zmierzona wynosi 5.4 V co odpowiada Zef = 1.25e.

Oderwanie drugiego elektronu wymaga potencjału aż 75.6 V. Zatem w związkach chemicznych lit powinien zawsze wykazywać wartościowość +1.

Z = 4, Beryl

Zgodnie z zasadą Pauliego w stanie n = 2, l = 0 jest miejsce dla dwóch elektronów. Dla berylu drugi potencjał jonizacyjny nie jest więc dużo większy od pierwszego i beryl w związkach chemicznych ma wartościowość +2.

Wprowadźmy teraz do opisu konfiguracji następującą konwencję: numer powłoki (n) piszemy cyfrą, natomiast podpowłoki: l = 0, 1, 2, 3 4 oznaczmy literami s, p, d, f. Wskaźnik górny przy symbolu podpowłoki określa liczbę znajdujących się w niej elektronów a wskaźnik dolny przy symbolu chemicznym pierwiastka określa wartość Z.

Tak więc konfiguracje dotychczas omawianych pierwiastków zapiszemy w postaci

1H : 1s1

2He : 1s2

3Li : 1s22s1

4Be : 1s22s2

Od Z = 5 (Boru) do Z = 10 (neonu)

W tych sześciu pierwiastkach elektrony zapełniają podpowłokę 2p (n = 2, l = 1)

5B : 1s22s22p1

10Ne : 1s22s22p6

Wśród tych pierwiastków znajdują się fluor i tlen, którym do zapełnienia orbity p brakuje odpowiednio 1 i 2 elektrony. Pierwiastki te wykazują silną tendencję do przyłączenia dodatkowych elektronów tworząc trwałe jony Fl i O– –. To zjawisko jest zwane powinowactwem elektronowym.

Kontynuując powyższy schemat można napisać konfigurację elektronową dowolnego atomu. Okazuje się jednak, że w niektórych przypadkach obserwowane konfiguracje nie pokrywają się z obserwowanymi. Wnioskujemy, że różnice energii pomiędzy niektórymi podpowłokami muszą być tak małe, że w pewnych wypadkach może zostać odwrócona kolejność ich zapełniania. Można to zobaczyć na rysunku poniżej. Krzywe kończą się na Z = 80 (rtęć). Uwaga: skala energii nie jest liniowa.

Zwróćmy też uwagę, że każda podpowłoka p ma wyższą energię od poprzedzającej ją powłoki s. Natomiast różnice energii pomiędzy każdą podpowłoką s i poprzedzającą ją powłoką p są szczególnie duże. W konsekwencji wzbudzenie elektronu w atomach pierwiastków, w których zakończyło się właśnie zapełnianie powłoki p jest bardzo trudne (gazy szlachetne).

W ten sposób na gruncie mechaniki kwantowej (z uwzględnieniem spinu elektronu) można przeanalizować własności wszystkich pierwiastków.

Promienie X

Wielokrotnie mówiliśmy o zastosowaniu promieniowania rentgenowskiego. Teraz poznamy więcej szczegółów dotyczących widma tego promieniowania.

Na rysunku poniżej pokazana jest lampa rentgenowska.

Elektrony emitowane z katody K są przyspieszane przez napięcie U rzędu 104 V (przyłożone pomiędzy katodą i anodą) i wreszcie uderzają w anodę (tarczę). Elektrony są hamowane w anodzie, aż do ich całkowitego zatrzymania.

Zgodnie z fizyką klasyczną w wyniku tego hamowania (ładunek doznający przyspieszenia) powinna nastąpić emisja promieniowania elektromagnetycznego o widmie ciągłym.

Przykładowy rozkład widmowy rentgenowski otrzymany dla wolframu jest pokazany na wykresie poniżej.

Najbardziej charakterystycznymi cechami obserwowanych rozkładów widmowych promieniowania X są:

Istnienie krótkofalowej granicy widma ciągłego promieniowania X nie może być wyjaśnione przez klasyczną teorię elektromagnetyzmu. W świetle tej teorii nie istnieją żadne powody, aby z anody nie mogły być wysłane fale o długości mniejszej od jakiejś wartości granicznej.

Jeżeli jednak potraktujemy promieniowanie rentgenowskie jako strumień fotonów to wyjaśnienie obserwowanego zjawiska jest proste.

Elektron o początkowej energii kinetycznej Ek (uzyskanej dzięki napięciu U) w wyniku oddziaływania z ciężkim jądrem atomu tarczy jest hamowany i energia jaką traci pojawia się w formie kwantów (rysunek).

Energia powstającego fotonu jest dana wzorem:

hv = Ek - Ek'

gdzie Ek' jest energią elektronu po zderzeniu. Elektron w trakcie zderzenia przekazuje jądru pewną energię jednak ze względu na to, że jądra tarczy są bardzo ciężkie (w porównaniu do elektronu) możemy ją zaniedbać.

Długość fali fotonu można obliczyć z relacji

W wyniku zderzeń elektrony tracą różne ilości energii typowo elektron zostaje zatrzymany w wyniku wielu zderzeń z jądrami tarczy - otrzymujemy szereg fotonów o różnych energiach (różnych λ). Wobec tego promieniowanie rentgenowskie wytwarzane przez wiele elektronów będzie miało widmo ciągłe.

Powstaje wiele fotonów o długościach od λmin do λ → ∞, co odpowiada różnym energiom traconym w zderzeniach.

Foton o najmniejszej długości fali λmin (maksymalnej energii) będzie emitowany wtedy gdy elektron straci całą energię w jednym procesie zderzenia. Oznacza to, że po tym zderzeniu Ek' = 0 więc

(36.4)

Ponieważ energia kinetyczna jest równa eU (elektron przyspieszony napięciem U) więc zachodzi relacja

czyli

(36.5)

Tak więc minimalna długość fali odpowiadająca całkowitej zamianie energii kinetycznej elektronów na promieniowanie zależy jedynie od U, a nie zależy np. od materiału z jakiego zrobiono tarczę (anodę).

Podobnie na gruncie fizyki kwantowej można wyjaśnić powstawanie widma liniowego (charakterystycznego).

Elektron z wiązki padającej przelatując przez atom anody, niekiedy przechodzi w pobliżu elektronu podpowłoki wewnętrznej. W wyniku oddziaływania kulombowskiego między tymi elektronami może dojść do wybicia elektronu z podpowłoki poza atom. Pozostawia to atom w stanie wysoko wzbudzonym ponieważ ubył elektron o dużej energii wiązania. Atom ostatecznie powróci do stanu podstawowego, emitując serię fotonów wysokoenergetycznych.

Aby to szczegółowo prześledzić rozpatrzmy atom anody, z którego podpowłoki 1s został usunięty elektron. W pierwszym kroku powrotu atomu do stanu podstawowego elektron z jednej z podpowłok o mniej ujemnej (wyższej) energii np. elektron 2p, przechodzi na wolne miejsce w podpowłoce 1s. Pozostawia to dziurę w podpowłoce 2p. Towarzyszy temu emisja fotonu o energii równej spadkowi energii wzbudzenia tj. różnicy energii atomu z brakującym elektronem 1s i atomu z brakującym elektronem 2p. Oczywiście dziura w podpowłoce 2p może być zapełniona przez elektron 3d, a powstała dziura w podpowłoce 3d przez elektron 4p itd.

Zazwyczaj proces powrotu atomu do stanu podstawowego składa się z kilku kroków. W każdym kroku dziura przeskakuje do podpowłoki o mniej ujemnej energii, aż przejdzie do najbardziej zewnętrznej podpowłoki gdzie zostanie zajęta przez jakiś elektron będący w pobliżu. Atom jest znowu w stanie podstawowym i jest obojętny elektrycznie. Każdemu przejściu dziury do stanu o mniej ujemnej energii towarzyszy emisja fotonu o energii równej spadkowi energii wzbudzenia. W ten sposób powstaje widmo liniowe. Ponieważ przejścia odbywają się pomiędzy podpowłokami atomu anody więc wysyłane promieniowanie X jest charakterystyczne dla atomów konkretnego pierwiastka anody.

Liniowe widma rentgenowskie są interesujące praktyczni ze względu na wiele użytecznych zastosowań w nauce i technice.

Wykład 37

Materia skondensowana

Wstęp

Kiedy pierwiastek lub związek chemiczny, będący w stanie gazowym lub ciekłym, zostanie dostatecznie ochłodzony to kondensuje czyli przechodzi do stanu stałego.

Większość związków ma strukturę krystaliczną. Atomy ułożone są w powtarzający się regularny wzór zwany siecią krystaliczną. Np. ziarna soli kuchennej tworzą sześciany oparte na powtarzającym się elementarnym sześcianie pokazanym na rysunku poniżej. Pozycje atomów Na i Cl są zaznaczone odpowiednio małymi i dużymi kulami.

Wiele ciał stałych nie przypomina kryształów ale jest zbudowana z bardzo wielu malutkich kryształków; mówimy, że mają strukturę polikrystaliczną. Wreszcie w przyrodzie występują ciała niekrystaliczne tzn. takie, w których uporządkowanie atomowe nie rozciąga się na duże odległości.

W dalszej części wykładu zajmiemy się tylko ciałami krystalicznymi.

Klasyfikacje takich ciał prowadzi się według dominującego rodzaju wiązania.

Rodzaje kryształów (rodzaje wiązań)

Ze względu na typy wiązań kryształy dzielimy na:

Kryształy cząsteczkowe

Składają się ze stabilnych cząsteczek, które zachowują wiele swoich cech indywidualnych nawet przy zbliżaniu ich do siebie.

Dla porównania energia termiczna cząsteczki (wpływająca na rozerwanie wiązania) w temperaturze pokojowej (300 K) wynosi .

Widać, że zestalenie może mieć miejsce dopiero w niskich i bardzo niskich temperaturach, gdzie efekty rozrywające wiązanie, wynikające z ruchu termicznego, są bardzo małe. Np. temperatura topnienia stałego wodoru wynosi 14 K (tj. -259 °C).

Kryształy o wiązaniach wodorowych

W pewnych warunkach atomy wodoru mogą tworzyć silne wiązania z atomami pierwiastków elektroujemnych takich jak np. tlen czy azot. Te wiązania zwane wodorowymi odgrywają ważną rolę min. w kryształach ferroelektrycznych i w cząsteczkach kwasu DNA (dezoksyrybonukleinowego).

Kryształy jonowe

Np. chlorek sodu. Takie kryształy składają się z trójwymiarowego naprzemiennego ułożenia dodatnich i ujemnych jonów, o energii niższej niż energia odosobnionego jonu.

Wiązanie jonowe nie ma wyróżnionego kierunku (sferycznie symetryczne zamknięte powłoki). Jony są ułożone jak gęsto upakowane kulki.

Kryształy atomowe (kowalentne)

Np. German, Krzem. Składają się z atomów połączonych ze sobą parami wspólnych elektronów walencyjnych.

  1. Są niepodatne na odkształcenia i posiadają wysoką temperaturę topnienia.

Ciała metaliczne

Wiązanie metaliczne można sobie wyobrazić jako graniczny przypadek wiązania kowalentnego, w którym elektrony walencyjne są wspólne dla wszystkich jonów w krysztale a nie tylko dla jonów sąsiednich.

Gaz elektronowy działa na każdy jon siłą przyciągania większą od odpychania pozostałych jonów - stąd wiązanie.

Wprawdzie w tych atomach na zewnętrznych podpowłokach są wolne miejsca ale jest za mało elektronów walencyjnych (na atom) aby utworzyć wiązanie kowalentne.

  1. Kryształy metaliczne są doskonałymi przewodnikami elektryczności i ciepła.

Wszystkie metale alkaliczne tworzą kryształy metaliczne.

W podsumowaniu należy zaznaczyć, że istnieją kryształy, w których wiązania muszą być interpretowane jako mieszanina opisanych powyżej głównych typów wiązań.

Typ wiązania w poszczególnych kryształach wyznacza się doświadczalnie przez badanie: dyfrakcji promieni X, własności dielektrycznych, widm optycznych itp..

Pasma energetyczne

W odróżnieniu od atomów (i cząsteczek) gdzie ruch elektronów jest ograniczony do małego obszaru przestrzeni, w ciałach stałych elektrony walencyjne mogą się poruszać w całej objętości ciała przechodząc od atomu do atomu.

Ruch elektronów w kryształach jest więc czymś pośrednim pomiędzy ruchem wewnątrzatomowym a ruchem swobodnych elektronów w próżni.

W kryształach mamy sytuacje pośrednią. Gdy duża liczba atomów jest zbliżana do siebie następuje poszerzenie atomowych poziomów energetycznych tworzą się tzw. pasma energetyczne tak jak pokazano na rysunku na następnej stronie.

Silnie związane elektrony wewnętrzne w atomie pozostają zlokalizowane w atomach. Elektronom tym odpowiadają najniższe dyskretne (atomowe) poziomy energii.

Energie elektronów walencyjnych układają się w przedziały - pasma. Pasma są tym szersze im słabsza więź elektronów z jądrami atomowymi (czyli im bardziej przypominają elektrony swobodne).

Pasma energetyczne są oddzielone obszarami wzbronionymi czyli przedziałami energii nie dostępnych dla elektronów.

r0 - odległość międzyatomowa w krysztale.

Pasmowa struktura widma energetycznego elektronów pozwoliła wyjaśnić wiele podstawowych właściwości ciał stałych.

Przede wszystkim pozwoliła wytłumaczyć dlaczego, mimo że odległości międzyatomowe i energie oddziaływań w metalach, półprzewodnikach i dielektrykach są tego samego rzędu to oporność elektryczna tych substancji różni się o 25 rzędów wielkości: od około 10-6 w metalach do 1019 Ωcm w dielektrykach.

Substancje o częściowo wypełnionych pasmach są więc metalami a substancje, w których występują tylko całkowicie zapełnione lub puste stany energetyczne są dielektrykami lub półprzewodnikami (rysunek).

Całkowicie zapełnione pasma w kryształach nazywamy pasmami walencyjnymi, a częściowo zapełnione (lub puste) pasmami przewodnictwa.

Jeżeli szerokość obszaru oddzielającego najwyższe pasmo walencyjne od pasma przewodnictwa (tzw. przerwa energetyczna lub pasmo wzbronione) jest duża to materiał ten jest dielektrykiem we wszystkich temperaturach (aż do temperatury topnienia).

Jeżeli jednak przerwa jest dostatecznie wąska to w odpowiedniej temperaturze dzięki energii cieplnej część elektronów może zostać przeniesiona do pustego pasma. Kryształ, który w T = 0 K był izolatorem teraz będzie przewodził a jego przewodność szybko rośnie (opór spada) wraz z temperaturą. Jeżeli przerwa jest mniejsza niż 1 eV to przewodnictwo staje się wyraźne już w temperaturze pokojowej.

Substancje z taką przerwą nazywamy półprzewodnikami.

Fizyka półprzewodników

W tym punkcie przedstawione zostaną podstawowe właściwości półprzewodników oraz ich zastosowania.

Materiały te zrewolucjonizowały elektronikę i współczesną technologię dlatego zostały wybrane do omówienia.

Gdy elektron znajdujący się w paśmie walencyjnym np. Ge zostanie wzbudzony termicznie, wówczas powstaje w tym paśmie miejsce wolne, a zostaje zapełniony stan w paśmie przewodnictwa. Pusty stan w paśmie walencyjnym nazywany jest dziurą. Na rysunku zaznaczono symbolicznie tę sytuację.

W obecności zewnętrznego pola elektrycznego inny elektron walencyjny, sąsiadujący z dziurą może zająć jej miejsce, pozostawiając po sobie nową dziurę, która zostanie zapełniona przez kolejny elektron itd. Zatem dziura przemieszcza się w kierunku przeciwnym niż elektron i zachowuje jak nośnik ładunku dodatniego (dodatni elektron).

Liczba dziur jest równa liczbie elektronów przewodnictwa. Takie półprzewodniki nazywamy samoistnymi.

Domieszkowanie półprzewodników

Jeżeli w trakcie wzrostu kryształów do roztopionego germanu dodamy niewielką ilość arsenu (grupa 5 układu okresowego) to arsen wbudował się w strukturę germanu wykorzystując cztery spośród pięciu elektronów walencyjnych. Pozostały elektron nie bierze udziału w wiązaniu i łatwo staje się elektronem przewodnictwa. Dzięki temu w paśmie przewodnictwa jest prawie tyle elektronów ile atomów arsenu (domieszki). Zazwyczaj liczba ta jest większa niż liczba elektronów wzbudzonych termicznie z pasma walencyjnego. Taki półprzewodnik nazywany jest półprzewodnikiem typu n (negative).

German można też domieszkować galem (grupa 3 układu okresowego). W takim przypadku atom galu będzie miał tendencję do wychwytywania elektronu z sąsiedniego atomu germanu aby uzupełnić cztery wiązania kowalencyjne. Zatem atom galu wprowadza dziurę i mamy półprzewodnik typu p (positive).

Zastosowania półprzewodników

Termistor

W miarę wzrostu temperatury obserwujemy szybki wzrost przewodności (spadek oporu) półprzewodników. Np. przewodność czystego krzemu zwiększa się aż dwukrotnie przy wzroście temperatury od 0° C do 10° C. Dlatego czysty krzem może być stosowany w czułych miernikach temperatury. Taki przyrząd (wykonany z czystego półprzewodnika) jest nazywany termistorem.

Złącze p - n

Jeżeli półprzewodnik typu n i półprzewodnik typu p zostaną ze sobą zetknięte to część elektronów z obszaru typu n będzie przepływała do obszaru typu p, a dziury będą przepływały z obszaru typu p do obszaru typu n.

W wyniku tego obszar p naładuje się ujemnie (dodatkowymi elektronami) a obszar typu n dodatnio. Powstaje kontaktowa różnica potencjałów pokazana na rysunku poniżej.

Jeżeli do takiego złącza p - n przyłożymy zewnętrzny potencjał to wielkość prądu płynącego przez złącze zależy od kierunku i wartości tego napięcia tak jak pokazano na wykresie poniżej.

Dla dodatniego napięcia prąd jest zazwyczaj wielokrotnie większy od I0 podczas gdy dla ujemnego napięcia (napięcie zaporowe) maksymalna wartość prądu wynosi I0. To urządzenie jest nazywane diodą p - n. Jednym z jego zastosowań są detektory radioodbiorników o modulacji amplitudowej.

Baterie słoneczne

Jeżeli oświetlimy obszar przejściowy złącza p - n to elektrony z pasma walencyjnego zostaną wzbudzone do pasma przewodnictwa (tak samo jak energią cieplną). Każdy pochłonięty foton kreuje parę elektron - dziura.

Powstałe dziury są wciągane do obszaru p, a elektrony do obszaru n. Jeżeli mamy zamknięty obwód to płynie w nim prąd.

W ten sposób można zamienić światło bezpośrednio na energię elektryczną.

Fotodiody

Gdy do baterii słonecznej przyłożymy napięcie zaporowe to prąd I0 wzrośnie wielokrotnie dzięki dodatkowym nośnikom wytworzonym przez padające światło.

Fotoprąd jest proporcjonalny do szybkości padania fotonów. Urządzenie jest bardzo czułe i znalazło zastosowanie np. jako detektor zmian natężenia światła.

Diody świecące

Diody świecące są zasilane napięciem w kierunku przewodzenia na tyle dużym, że przyspieszane elektrony w trakcie zderzeń wytwarzają pary elektron ‑ dziura. Tym procesom tworzenia par elektron - dziura towarzyszą procesy odwrotne (tzw. rekombinacja), w których elektrony mogą ponownie obsadzić dziurę. Każdemu aktowi rekombinacji towarzyszy emisja fotonu o energii hv ≈ Eprzerw . Tak więc częstotliwość (barwa) emitowanego światła zależy od przerwy energetycznej, która jest charakterystyczna dla danego materiału półprzewodnikowego.

Tranzystor

Schemat tranzystora pnp jest pokazany na rysunku na następnej stronie.

Można sobie wyobrazić, że tranzystor jest diodą, do której dołączono dodatkowy obszar p (kolektor).

Do „diody” jest przyłożone napięcie w kierunku przewodzenia więc płynie duży prąd (dziurowy) z emitera do bazy. Baza jest na tyle cienka, że większość dziur dyfunduje do kolektora, a tylko niewielka część (1%) wypływa z bazy (Ibe).

Pozostały prąd (99%) wypływa przez kolektor. Kolektor jest na bardziej ujemnym potencjale niż baza by dodatnie dziury łatwiej mogły do niego przechodziły. Stosunek prądu kolektora do prądu bazy nazywamy współczynnikiem wzmocnienia prądu: .

Dla typowego tranzystora β = 100 tzn. słaby prąd wejściowy bazy Ibe może kontrolować 100 razy większy prąd wyjściowy kolektora Ike.

Np. Ibe jest słabym sygnałem antenowym. Wówczas prąd Ike jest takim samym przebiegiem ale o wartości 100 razy większej.

Charakterystyki tranzystorów npn są takie same.

Inne urządzenia

Istnieje jeszcze wiele innych urządzeń półprzewodnikowych. Z konieczności ograniczymy się tylko do wymienienia najważniejszych: układy scalone dużej skali integracji; diody tunelowe; diody Zenera; tyrystory; tranzystory polowe; lasery półprzewodnikowe.

Własności magnetyczne ciał stałych

Ze zjawiskami magnetycznymi spotykamy się na co dzień. Najczęściej mamy do czynienia z magnesami stałymi ponieważ są one powszechnie wykorzystywane we wszelkich urządzeniach technicznych.

Omówienie własności magnetycznych rozpoczniemy od przypomnienia obliczeń, z Wykładu 21. Pokazaliśmy tam, że elektron krążący w odległości r wokół jądra w atomie posiada magnetyczny moment dipolowy związany z orbitalnym momentem pędu L. Podobnie jak z orbitalnym momentem pędu elektronu również z jego spinem związany jest moment magnetyczny tzw. spinowy moment magnetyczny.

Własności magnetyczne ciał są określone przez zachowanie się tych elementarnych momentów (dipoli) magnetycznych w polu magnetycznym.

Przy opisie własności magnetycznych ciał posługujemy się pojęciem wektora polaryzacji magnetycznej M nazywanej też namagnesowaniem lub magnetyzacją. Wektor ten określa sumę wszystkich momentów magnetycznych, czyli wypadkowy moment magnetyczny jednostki objętości. Jeżeli próbkę zawierającą elementarne dipole magnetyczne umieścimy w jednorodnym polu magnetycznym o indukcji B0 to pole to dąży do ustawienia dipoli w kierunku pola i w efekcie powstaje w próbce wypadkowe pole o indukcji

(35.1)

Względną przenikalnością magnetyczną ośrodka µr można na podstawie wzoru (35.1) zapisać jako

(35.2)

gdzie wielkość χ nazywana jest podatnością magnetyczną.

W zależności od wielkości i znaku podatności magnetycznej χ , dzielimy ciała na następujące trzy grupy:

Diamagnetyzm

Diamagnetyzm jest związany ze zmianą orbitalnego momentu pędu elektronów wywołaną zewnętrznym polem magnetycznym. Oznacza to, że diamagnetyzm występuje w każdym materiale umieszczonym w polu magnetycznym (w każdym materiale są elektrony). Jednak doświadczalnie jest on obserwowany tylko w ciałach, w których momenty magnetyczne elektronów wchodzących w skład danego atomu znoszą się wzajemnie (kompensują) tak, że moment magnetyczny atomu jest równy zeru. W innym przypadku efekt ten jest maskowany przez wypadkowy moment magnetyczny atomów. Diamagnetykami są na przykład te ciała, których atomy lub jony posiadają wypełnione powłoki elektronowe.

Jeżeli atom diamagnetyczny umieścimy w zewnętrznym polu magnetycznym to na elektrony działa siła magnetyczna F = -ev×B, która powoduje zmianę siły dośrodkowej działającej na elektron i zmienia prędkość kątową elektronów. Zmiana ta zależy od kierunku ruchu elektronu względem pola B i dlatego nie jest jednakowa dla wszystkich elektronów. Oznacza to, że momenty magnetyczne elektronów przestały się kompensować. W zewnętrznym polu magnetycznym B został wyindukowany moment magnetyczny, o kierunku przeciwnym do B. W efekcie próbka diamagnetyczna jest odpychana od bieguna silnego magnesu, a jej podatność magnetyczna χ jest ujemna.

Paramagnetyzm

Paramagnetykami są ciała, których atomy posiadają wypadkowy moment magnetyczny różny od zera. Przykładem mogą być atomy o nieparzystej liczbie elektronów, w których wypadkowy spin elektronów będzie zawsze większy od zera. Podatność paramagnetyków ma wartość nieznacznie większą od zera. W zewnętrznym polu magnetycznym atomowe dipole magnetyczne dążą do ustawienia równoległego do kierunku pola. Jednak ten proces jest silnie zakłócany przez energię drgań termicznych (energię cieplną) tak, że efektywny moment magnetyczny jest dużo mniejszy od maksymalnego, możliwego do uzyskania. Te ruchy cieplne są odpowiedzialne za to, że po usunięciu pola magnetycznego znika namagnesowanie i momenty dipolowe paramagnetyka są całkowicie nieuporządkowane.

Dla paramagnetyków (nie zawierających elektronów swobodnych) podatność magnetyczna zależy od temperatury zgodnie z prawem Curie

(35.3)

gdzie C jest stałą Curie.

Ferromagnetyzm

Istnieją pierwiastki takie jak Fe, Co, Ni oraz wiele różnych stopów, w których obserwujemy uporządkowanie magnetyczne pomimo, przeciwdziałających temu, ruchów termicznych atomów. Substancje te zwane ferromagnetykami charakteryzują się dużą podatnością, przy czym wielkość namagnesowania zależy zarówno od pola magnesującego jak i od tego czy były one magnesowane wcześniej. Jest to związane z silnym oddziaływaniem wymiennym jakie występuje pomiędzy spinowymi momentami magnetycznymi atomów. Ferromagnetyzm jest więc własnością kryształów, a nie pojedynczych atomów. Poszczególne atomy (tak jak w paramagnetyku) posiadają momenty magnetyczne, które podczas krystalizacji, w wyniku oddziaływania wymiennego, ustawiają się równolegle do siebie w dużych obszarach kryształu zwanych domenami. Każda domena jest więc całkowicie magnetycznie uporządkowana. Natomiast kierunki momentów magnetycznych poszczególnych domen są różne i próbka jako całość może nie mieć wypadkowego namagnesowania. Na rysunku poniżej po lewej stronie pokazano fragment nienamagnesowanego ferromagnetyka.

Linie pokazują granice domen, a strzałki oznaczają kierunek momentu magnetycznego w domenie.

Jeżeli taki materiał ferromagnetyczny umieścimy w zewnętrznym polu magnetycznym zaobserwujemy, że próbka uzyskuje duże namagnesowanie w relatywnie niskim polu magnetycznym. Dzieje się tak dlatego, że momenty magnetyczne atomów wewnątrz domen dążą do ustawienia się zgodnie z polem oraz, że przesuwają się ściany domen: domeny zorientowane zgodnie z polem rosną kosztem domen o innej orientacji. Ten proces nie jest całkowicie odwracalny. Po usunięciu pola granice domen nie wracają do położeń początkowych i materiał pozostaje namagnesowany trwale. Zjawisko to nazywamy histerezą magnetyczną. Na rysunku, poniżej prawej pokazana jest krzywa (ab) namagnesowania ferromagnetyka (początkowo nienamagnesowanego) i towarzysząca jej pętla histerezy (bcdeb).

Nienamagnesowany (punkt a) materiał ferromagnetyczny magnesujemy zewnętrznym polem magnetycznym B0 aż do wartości odpowiadającej punktowi b. Następnie zmniejszamy pole magnesujące do zera. Namagnesowanie materiału maleje ale nie znika całkowicie (punkt c); materiał został namagnesowany trwale. Namagnesowanie w punkcie c nosi nazwę pozostałości magnetycznej. Następnie, ponownie zwiększamy pole magnesujące ale w kierunku przeciwnym do namagnesowania. Trwałe namagnesowanie ferromagnetyka zostaje usunięte dopiero po osiągnięciu wartości pola magnetycznego nazywanego polem koercji (punkt d). Dalsze zwiększanie pola magnesującego pozwala ponownie namagnesować materiał ale w nowym kierunku (punkt e). Możemy teraz powtórzyć postępowanie opisane powyżej i w efekcie powrócić do punktu b. Krzywa (bcdeb) nosi nazwę pętli histerezy.

Pozostałość magnetyczna i pole koercji są parametrami, które decydują o przydatności danego materiału jako magnesu trwałego. Duża pozostałość magnetyczna gwarantuje, że będziemy mieli silny magnes, a duże pole koercji, że będzie on trwały (nie zostanie łatwo rozmagnesowany). Materiałami, które posiadają najlepsze wartości tych parametrów są obecnie SmCo5 i Nd2Fe14B.

O przydatności ferromagnetyka jako magnesu trwałego decyduje również zależność jego podatności od temperatury bo powyżej pewnej charakterystycznej temperatury TC ferromagnetyk staje się paramagnetykiem. Temperaturę TC nazywamy temperaturą Curie. Z punktu widzenia zastosowań istotne jest aby materiał ferromagnetyczny miał możliwie wysoką temperaturę przejścia w stan paramagnetyczny.

Wykład 38

Fizyka jądrowa

Wstęp

Każde jądro atomowe składa się z protonów i neutronów wiązanych siłami jądrowymi, niezależnymi od ładunku.

Ponieważ neutron i proton mają prawie taką samą masę i bardzo zbliżone inne własności, więc obydwa określa się wspólną nazwą nukleon.

Nazwa nuklid jest używana zamiennie z terminem jądro.

Nuklidy o tej samej liczbie protonów, różniące się liczbą neutronów nazywamy izotopami.

Łączną liczbę protonów i neutronów w jądrze nazywamy liczbą masową jądra i oznaczamy literą A. Liczba neutronów jest dana równaniem A - Z, gdzie Z jest liczbą protonów zwaną liczbą atomową.

Wartość liczby A dla jądra atomowego jest bardzo bliska masie odpowiadającego mu atomu.

Rozmiary jąder

Wiązka wysokoenergetycznych protonów lub neutronów może zostać rozproszona wskutek dyfrakcji na jądrze o promieniu R. Analizując powstały obraz dyfrakcyjny (położenie maksimów) można wyznaczyć ten promień.

Wyniki pomiarów (również innymi technikami) pokazują, że średni promień dla wszystkich jąder oprócz najmniejszych jest dany wzorem:

R ≈ (1.2·10-15 m) A1/3

W fizyce jądrowej i cząstek elementarnych wielkość 10-15 pojawia się często i dlatego wprowadzono dla niej osobną nazwę fermi. 1 fermi = 1 fm = 10-15 m.

Przykład 1

Jaka jest gęstość masy i gęstość cząsteczek w materii jądrowej ?

Dla jądra o promieniu R i liczbie masowej A liczba cząstek na jednostkę objętości wynosi

skąd

N = 1.38·1044 nukleonów/m3

Gęstość masy to iloczyn tej liczby N i masy nukleonu

ρ = N Mp = (1.38·1044) (1.67·10-27) kg/m3 = 2.3·1017 kg/m3

Odpowiada to masie około 230 milionów ton dla 1 cm3.

Gęstość materii jądrowej nie zależy od rozmiarów jądra, ponieważ jego objętość jest proporcjonalna do liczby masowej A.

Oddziaływanie nukleon-nukleon

Dotychczas poznane oddziaływania (grawitacyjne, elektromagnetyczne) nie pozwalają na wyjaśnienie struktury jądra atomowego. Aby wyjaśnić co tak silnie wiąże nukleony w jądrach atomowych trzeba wprowadzić nowe oddziaływanie. Ta siła wiążąca musi być większa niż siła odpychania elektrostatycznego występująca pomiędzy protonami. Określamy ją mianem siły jądrowej lub oddziaływania silnego.

Potencjał opisujący to oddziaływanie jest o rząd wielkości większy niż energia potencjalna elektrostatycznego odpychania proton - proton. Sytuacja ta jest pokazana na rysunku poniżej.

Oddziaływanie proton - proton, proton - neutron i neutron - neutron jest identyczne (jeżeli zaniedbamy relatywnie małe efekty odpychania elektrostatycznego) i nazywamy go oddziaływaniem nukleon - nukleon.

Masy atomowe i energie wiązań można wyznaczyć doświadczalnie w oparciu o spektroskopię masową lub bilans energii w reakcjach jądrowych.

W tabeli na następnej stronie zestawione są masy atomowe i energie wiązań jąder ΔE dla atomów wybranych pierwiastków.

Masa jest podana w jednostkach masy atomowej (u). Za wzorzec przyjmuje się 1/12 masy atomowej węgla .

Z A Masa (u) ΔE (MeV) ΔE/A
0 1 1.0086654 --- ---
1 1 1.0078252 --- ---
1 2 2.0141022 2.22 1.11
1 3 3.0160500 8.47 2.83
2 3 3.0160299 7.72 2.57
2 4 4.0026033 28.3 7.07
4 9 9.0121858 58.0 6.45
6 12 12.0000000 92.2 7.68
8 16 15.994915 127.5 7.97
29 63 62.929594 552 8.50
50 120 119.9021 1020 8.02
74 184 183.9510 1476 8.02
92 238 238.05076 1803 7.58

W oparciu o dane zestawione w tabeli można uzyskać dalsze informacje o jądrach atomowych.

Dla przykładu porównajmy masę atomu z sumą mas jego składników.

M() = 4.0026033 u

Całkowita masa jego składników równa jest sumie mas dwu atomów i dwu neutronów tzn.

2M() + 2M() = 2·1.0078252 u + 2·1.0086654 u = 4.0329812 u

Uwaga: zarówno w skład masy helu jak i dwu mas wodoru wchodzą masy dwu elektronów.

Wynik: masa helu jest mniejsza od masy składników o wartość 0.0303779 u.

Dla każdego atomu analogiczny rachunek pokazałby, że masa atomu jest mniejsza od masy jego składników o wielkość ΔM zwaną niedoborem masy.

Wynik ten jest świadectwem energii wiązania jąder jak i równoważności masy i energii.

Jeżeli rozważymy dowolny składnik jądra helu to skoro jest on związany z jądrem to ma ujemną energię E < 0 (rysunek na stronie 3). Innymi słowy, żeby taki nukleon przybył z odległości r ∞ (E = 0) i mógł z innym nukleonami utworzyć jądro, jego energia musi ulec zmniejszeniu. To samo dotyczy każdego z pozostałych nukleonów w jądrze.

Oznacza to, że gdy układ oddzielnych swobodnych nukleonów łączy się w jądro energia układu musi zmniejszyć o wartość ΔE energii wiązania jądra.

Zmniejszeniu o ΔE całkowitej energii układu musi towarzyszyć, zgodnie z teorią względności, zmniejszenie masy układu o ΔM, gdzie ΔM c2 = ΔE.

Dla niedobór masy wynosi ΔM = 0.0303779 u, więc energia wiązania jest równa ΔE = ΔM c2 = 28.3 MeV.

W ostatniej kolumnie tabeli podana jest wielkość energii wiązania na nukleon w jądrze. Jest to jedna z najważniejszych cech charakteryzujących jądro.

Zauważmy, że początkowo ΔE/A wzrasta ze wzrostem A, ale potem przybiera w przybliżeniu stałą wartość około 8 MeV. Wyniki średniej energii wiązania na nukleon w funkcji liczby masowej jądra A są pokazane na rysunku poniżej.

Gdyby każdy nukleon w jądrze przyciągał jednakowo każdy z pozostałych nukleonów to energia wiązania na nukleon byłaby proporcjonalna do A.

Fakt, że ΔE/A nie jest proporcjonalne do A wynika głownie z krótkiego zasięgu sił jądrowych. Widać, że najsilniej są wiązane nukleony w jądrach pierwiastków ze środkowej części układu okresowego.

Rozpady jądrowe i reakcje jądrowe

Rozpad alfa

Rozpady jądrowe zachodzą zawsze (prędzej czy później) jeśli jądro o pewnej liczbie nukleonów znajdzie się w stanie energetycznym, nie będącym najniższym możliwym dla układu o tej liczbie nukleonów.

Takie nietrwałe (w stanach niestabilnych) jądra powstają w wyniku reakcji jądrowych. Niektóre reakcje są wynikiem działań laboratoryjnych, inne dokonały się za sprawą przyrody podczas powstawania naszej części Wszechświata. Jądra nietrwałe pochodzenia naturalnego są nazywane promieniotwórczymi, a ich rozpady noszą nazwę rozpadów promieniotwórczych (promieniotwórczości).

Rozpady promieniotwórcze dostarczają wielu informacji o samych jądrach atomowych (budowie, stanach energetycznych, oddziaływaniach) ale również wielu zasadniczych informacji o pochodzeniu Wszechświata.

Szczególnie ważnym rozpadem promieniotwórczym jest rozpad alfa (α) występujący zazwyczaj w jądrach o Z ≥ 82. Z przyczyn historycznych jądro 4He jest nazywane cząstką α. Rozpad α polega na przemianie niestabilnego jądra w nowe jądro przy emisji jądra 4He tzn. cząstki α.

Proces zachodzi samorzutnie bo jest korzystny energetycznie. Energia wyzwolona w czasie rozpadu (energetyczny równoważnik niedoboru masy) jest unoszona przez cząstkę α w postaci energii kinetycznej.

Przykładowa reakcja dla jądra uranu wygląda następująco

238U 234Th + 4He + 4.2 MeV

Rozpatrzmy teraz układ zawierający w chwili początkowej wiele jąder tego samego rodzaju. Jądra te podlegają rozpadowi α (równie dobrze rozpadowi β) z częstością rozpadów λ. Chcemy znaleźć liczbę jąder, która nie uległa rozpadowi po czasie t od chwili początkowej.

Oznaczamy przez N liczbę jąder. Wtedy dN (<0) oznacza liczbę jąder, które rozpadają się w czasie dt.

Spodziewana liczba rozpadów (liczba jąder, które się rozpadną) w czasie dt tzn. (t, + dt) jest dana wyrażeniem

dN = – dt

gdzie znak minus wskazuje, że dN jest liczbą ujemną czyli, że N maleje z czasem.

Możemy rozdzielić zmienne i scałkować równanie obustronnie

czyli

skąd

(38.1)

N(0) jest liczbą jąder w chwili t = 0, a N(t) liczbą jąder po czasie t.

Powyższy wzór nazywamy wykładniczym prawem rozpadu.

Często wyraża się N(t) poprzez średni czas życia jąder, który z definicji jest równy odwrotności częstości rozpadów; τ = 1/λ.

Prawo rozpadu przyjmuje wtedy postać

N = N0e-t/τ (38.2)

Do scharakteryzowania szybkości rozpadu używa się czasu połowicznego rozpadu (zaniku) T1/2. Jest to taki czas, po którym liczba jąder danego rodzaju maleje do polowy tzn. N = (1/2) N0. Wstawiając to do równania (38.2), otrzymujemy

czyli

skąd

T1/2 = 0.693 τ (38.3)

Przykładowo dla 238U czas połowicznego zaniku wynosi 4.5·109 lat, a dla 212Po jest rzędu 10-6 s.

Promieniowanie γ

Jeśli jądro jest wzbudzone do wyższego stanu energetycznego, to może nastąpić samoczynna emisja fotonu i przejście do niższego stanu energetycznego. Ponieważ odległości między poziomami energetycznymi w jądrach są rzędu MeV więc fotony emitowane przez jądra mają energię tysiące razy większą od energii fotonów wysyłanych przez atomy. Takie wysokoenergetyczne fotony emitowane przez jądra nazywamy promieniowaniem γ.

Jądra w stanie wzbudzonym można łatwo otrzymać używając neutronów o małej energii. Jeżeli taki powolny neutron przechodzi np. przez bryłkę uranu 238U to zawsze gdy znajdzie się blisko jądra działa na niego siła przyciągająca wywołana przez oddziaływanie jądrowe. Dlatego jest bardzo prawdopodobne, że taki neutron zostanie wychwycony i powstanie jądro 239U* w stanie wzbudzonym (oznaczone *). Takie jądro przechodzi do stanu podstawowego emitując jeden lub kilka kwantów γ. Proces ten opisują następujące reakcje jądrowe:

n + 238U 239U*

239U* 239U + γ

Rozpad beta

Badając własności promieniotwórczości stwierdzono, że istnieją trzy rodzaje promieniowania α, β, γ. Po dalszych badaniach stwierdzono, że α to jądra helu, promienie γ to fotony, a promienie β to elektrony lub pozytony (cząstka elementarna dodatnia o masie równej masie elektronu).

Jądra, których ilość protonów Z różni się od wartości odpowiadającej stabilnym jądrom o tej samej liczbie masowej A, mogą zmieniać Z w kierunku jąder stabilnych poprzez rozpad β. Współczesna teoria rozpadów β została rozwinięta przez Fermiego w 1931 r.

Najprostszym przykładem rozpadu β jest rozpad swobodnego neutronu zachodzący z czasem połowicznego zaniku 12 minut

Neutron rozpada się na proton, elektron i antyneutrino (cząstka elementarna o zerowym ładunku i zerowej masie spoczynkowej).

Inny przykład to omawiany już uran 239U; rozpad zachodzi z czasem połowicznego zaniku 24 minuty

Powstały izotop też nie jest trwały i podlega rozpadowi β

z czasem połowicznego zaniku 2.35 dnia.

W takim procesie liczba Z wzrasta o jeden a liczba A pozostaje bez zmiany.

Innym rozpadem β, jest proces, w którym jądra emitują pozytony, a towarzyszy temu zawsze emisja neutrina. W tym procesie liczba Z maleje o jeden, a liczba A pozostaje bez zmiany.

Rozszczepienie jąder atomowych

Jak widzieliśmy w punkcie 38.3 energia wiązania na jeden nukleon wzrasta z liczbą masową aż do A ≈ 50. Jednak powyżej tej wartości ta energia maleje. Dzieje się tak dlatego, że siły jądrowe mają krótki zasięg i dla dwóch protonów oddalonych o więcej niż 2.5·10-15 m ich oddziaływanie jest raczej odpychające niż przyciągające (rysunek na stronie 38-2).

Konsekwencją tego jest występowanie zjawisk rozszczepienia i syntezy jądrowej. Jeżeli ciężkie jądro rozdzielimy na dwa mniejsze, te dwie części mogą mieć masę mniejszą niż masa jądra wyjściowego nawet o dziesiąte części procenta. Dlatego ciężkie jądra mają tendencję do rozpadania się na dwa mniejsze z wydzieleniem energii.

Energia w bombie atomowej i reaktorach jądrowych jest wydzielana w procesach rozszczepienia jądrowego.

Spontaniczne rozszczepienie jądra jest dozwolone przez zasadę zachowania energii. Jednak w naturalnych jądrach prawdopodobieństwo rozszczepienia jądra jest mniejsze niż prawdopodobieństwo rozpadu α. Prawdopodobieństwo rozszczepienia można wydatnie zwiększyć bombardując jądra neutronami. Tak dzieje się np. gdy jądro 235U lub 239Pu wychwyci powolny neutron.

Różnica pomiędzy masą jądra uranu a sumą mas produktów rozszczepienia jest taka, że w przeciętnej reakcji wydziela się 200 MeV energii co stanowi równoważnik 0.1% masy uranu. Oznacza to, że z 1g uranu otrzymujemy energię równą: E = 0.001·mc2 = 9·1010 J. Jest to około 3 miliony razy więcej niż energia wydzielana przy spalaniu 1g węgla. Z drugiej strony należy uwzględnić fakt, że uran jest dużo droższy od węgla i że instalacje w elektrownii jądrowej są też dużo droższe niż w konwencjonalnej. Ciągle jednak energia jądrowa jest znacznie tańsza niż z paliw tradycyjnych.

Rozszczepienie jądrowe może w reakcji łańcuchowej stać się procesem samopodtrzymującym się. W każdej reakcji rozszczepienia powstają dwa lub trzy neutrony. Jeżeli przynajmniej jeden z nich wywoła kolejne rozszczepienie to proces będzie sam się podtrzymywał. Ilość materiału powyżej, której jest spełniony powyższy warunek nazywamy masą krytyczną. Po raz pierwszy reakcję rozszczepienia przeprowadzono (Enrico Fermi) na Uniwersytecie Chicago w 1942 r.

Masa 235U i 239Pu może być też nadkrytyczna. Wtedy neutrony z jednego rozszczepienia wywołują więcej niż jedną reakcję wtórną (reakcja lawinowa). Cała masa nadkrytyczna może być zużyta (eksplodować) w czasie t < 0.001 s ze względu na dużą szybkość neutronów (3·108 cm/s). Tak eksploduje bomba atomowa. Najczęściej kulę o masie nadkrytycznej ale rozrzedzonej otacza się klasycznymi ładunkami wybuchowymi. Ich detonacja wywołuje wzrost ciśnienia zewnętrznego i gwałtownie zmniejsza objętość kuli.

Oczywiście w elektrowniach jądrowych spalanie paliwa odbywa się bardzo powoli. Wymaga to spowalniania neutronów i doboru warunków stacjonarnej pracy reaktora.

Reakcja syntezy jądrowej

W tabeli na stronie 38-3 widzimy, że masa dwóch lekkich jąder jest większa niż masa jądra powstającego po ich połączeniu. Jeżeli takie jądra zbliżymy do siebie na dostatecznie małą odległość, to przy powstawaniu nowego jądra wydzieli się energia związana z różnicą mas.

Np. dwa deuterony mogą się połączyć tworząc jądro helu przy czym 0.6% masy zostanie zamienione na energię. Widać, że ta metoda byłaby sześć razy wydajniejsza od omówionego rozszczepiania jąder uranu (0.1%). Poza tym mamy nieograniczone źródło deuteru w wodzie mórz i oceanów. Przeszkodą w otrzymywaniu energii tą metodą jest odpychanie kulombowskie, które nie pozwala zbliżyć się deuteronom na odległość porównywalną z zasięgiem przyciągających sił jądrowych. Reakcja ta byłaby możliwa gdyby deuter mógł być ogrzany do temperatury około 5·107 K. Reakcje, które wymagają takich temperatur nazywamy reakcjami termojądrowymi. Temperatury osiągane podczas wybuchu bomby atomowej są wystarczające do zapoczątkowania takiej reakcji. Raz zapoczątkowana reakcja termojądrowa wytwarza dostateczną ilość energii do utrzymania wysokiej temperatury dopóki materiał (większość) nie zostanie spalony. Jest to mechanizm działania bomby wodorowej.

Warunkiem uzyskania użytecznej energii z reakcji syntezy jądrowej jest prowadzenie reakcji w sposób kontrolowany.

Prowadzone są próby skonstruowania reaktora termojądrowego. Podstawowym problemem jest utrzymanie gazu o tak wysokiej temperaturze w ograniczonym obszarze przez dostatecznie długi czas aby wytworzona energia była większa od energii zużytej na uruchomienie reaktora. Stwarza to wiele problemów technicznych. Np. trzeba zapobiec stopieniu ścian pojemnika z gazem (plazmą). Używa się bardzo silnych pól magnetycznych próbując nie dopuścić do zetknięcia gazu (plazmy) ze ściankami.

Jak dotąd nie udało się przeprowadzić zakończonej sukcesem kontrolowanej reakcji termojądrowej. Eksperci uważają jednak, że jest to kwestia najbliższych lat.

W przyrodzie obserwuje się ciągłe wytwarzanie energii termojądrowej: procesy termojądrowe są źródłem energii gwiazd a więc i „naszego” słońca.

Cykl życia słońca

Na rysunku poniżej są przedstawione podstawowe fazy cyklu życia Słońca.

Uwaga na rysunku nie jest zachowana skala. Jeżeli przyjąć średnicę „naszego” Słońca za 1 to np. średnica białego karła wynosi ~0.009, a średnica protogwiazdy jest równa około 106.

Chmura

Większość teorii kosmologicznych za przodka gwiazd i planet uważa gaz, którego składnikiem był wodór.

Globule

Dalej trwa zagęszczanie materii pod wpływem grawitacji, czemu towarzyszy wzrost temperatury aż osiągnięte zostaje stadium protogwiazdy.

Protogwiazda

Jednak gdy energia gazu zmniejszy się przez promieniowanie elektromagnetyczne trwa dalsze zapadanie się protogwiazdy aż do pojawienia się nowego źródła energii, które może temu przeciwdziałać. Tym nowym źródłem są reakcje termojądrowe - powstaje Słońce.

Słońce

Nasze rozważania o Słońcu rozpocznijmy od obliczenia promienia Słońca w funkcji jego masy.

Zakładamy stałą gęstość wewnątrz Słońca (w rzeczywistości rdzeń ma większą gęstość niż warstwy przy powierzchni). Masa Słońca MS = 2·1030 kg.

Zapadanie się tej masy gazu wodorowego zostanie zatrzymane gdy ciśnienie termiczne wywołane ogrzewaniem gazu przez energię z reakcji termojądrowych wyrówna ciśnienie grawitacyjne.

Ciśnienie grawitacyjne wewnątrz jednorodnej kuli o promieniu R, możemy wyznaczyć z równania: p = ρgśrh, gdzie gśr jest wartością średnią przyspieszenia równą g/2; g jest przyspieszeniem na powierzchni kuli (w środku przyspieszenie jest równe zeru). Stąd

gdzie . Ostatecznie

Ciśnienie termiczne gazu (na podstawie równania stanu gazu doskonałego) wynosi

gdzie Mp jest masą protonu (masa cząsteczki gazu = masa atomu wodoru).

Porównanie tych dwóch ciśnień daje

lub

Teraz oceńmy jaka jest najniższa temperatura potrzebna do zbliżenia dwóch protonów na odległość 5·10-15 m. Każdy proton ma energię (3/2)kT, więc energia kinetyczna pary jest równa 3kT. Musi to równoważyć energię odpychania elektrostatycznego , stąd T = 1.1·109 K.

We wnętrzu gwiazdy wystarczy temperatura o jeden lub nawet dwa rzędy wielkości niższa, bo zawsze znajdzie się wystarczająca ilość protonów o prędkościach większych od średniej (rozkład prędkości) aby podtrzymać reakcję.

Tak więc temperatura, dla której zaczynają zachodzić reakcje termojądrowe jest rzędu 107 K. Dla tych danych otrzymujemy wartość promienia Słońca R = 7·108 m, co jest wartością dobrze zgodną z obserwowaną.

Można pokazać, że jeżeli masa początkowa jest większa niż 0.08 masy Słońca, to osiągnięta temperatura będzie dostatecznie wysoka, aby wywołać następujące reakcje termojądrowe

p + p D + e+ + v

p + D 3He + γ

3He + 3He 4He + p + p

Ten ciąg reakcji termojądrowych pokazany na rysunku poniżej jest znany jako cykl wodorowy.

W wyniku cyklu wodorowego 4 protony są zużyte do wytworzenia cząstki α, 2 pozytonów, 2 neutrin i 2 fotonów γ. Masa jądra helu stanowi 99.3% masy czterech protonów. Wydziela się energia związana z różnicą mas.

Cykl wodorowy jest głównym mechanizmem produkcji energii przez Słońce i inne gwiazdy bogate w wodór.

Energia wytwarzana przez Słońce jest ogromna. W ciągu sekundy 592 miliony ton wodoru jest zamieniane na 587.9 milionów ton helu. Różnica tj. 4.1 miliony ton jest zamieniana na energię (w ciągu sekundy). Odpowiada to mocy około 4·1026 W.

Przykład 1

Obliczmy po jakim czasie wypaliłoby się Słońce tj. gdyby cały wodór zamienił się w hel. Energia wytwarzana w cyklu wodorowym 2·1030 kg otrzymujemy

E = 0.007·Mc2 = 1.3·1045 J

Stąd

t = E/P = (1.3·1045 J) / (4·1026W) = 1011 lat

Jest to około 20 razy więcej niż dotychczasowy wiek Słońca.

Kiedy całe paliwo wodorowe w rdzeniu wypali się to rdzeń gwiazdy zacznie zapadać się pod wpływem grawitacji (w zewnętrznej warstwie nadal spalanie wodoru). Jednak ilość ciepła wytworzona z energii grawitacyjnej, przewyższa nawet ilość energii pochodzącej z reakcji termojądrowej. To ciepło powoduje, że zewnętrzne warstwy zaczynają się rozszerzać. Zaczyna się ekspansja, Słońce staje się czerwonym olbrzymem.

Czerwony olbrzym

Gdy masa rdzenia osiągnie wartość około 0.5 masy Słońca, temperatura we wnętrzu podnosi się do około 100 mln °K, co umożliwia przemianę helu w węgiel i tlen. Zapalenie helu przebiega bardzo gwałtownie.

Gwiazdy o małych masach nie zapalają helu w rdzeniu lecz ewoluują w stronę mgławic planetarnych.

Jeżeli gwiazda wypali hel w rdzeniu to przy braku promieniowania podtrzymującego warstwę zewnętrzną gwiazda zaczyna się szybko zapadać przechodząc do fazy białego karła.

Białe karły

Białe karły są gwiazdami o małych rozmiarach (zbliżonych do rozmiarów Ziemi) i olbrzymich gęstościach; np. masa 1 cm3 materii tej gwiazdy dochodzi do kilkudziesięciu ton (masa 1 cm3 materii ziemskiej wynosi średnio kilka g).

Gwiazdy te dalej świecą dzięki emisji energii grawitacyjnej uwalnianej przy kurczeniu się. Proces ten może być bardzo długotrwały.

Dalsza ewolucja zależy od masy gwiazdy.

Produktem stygnięcia białych karłów o małej masie są czarne karły.

Czarne karły

Czarne karły powstają w wyniku przejścia w procesie krystalizacji materii białych karłów do stanu stałego. Towarzyszy temu szybkie ostygnięcie całego obiektu do bardzo niskich temperatur (obiekt nie świeci).

Jeżeli w wyniku spalania helu masa rdzenia węglowo-tlenowego wzrośnie powyżej wartości około 1.4 masy Słońca to w centrum nastąpi zapalenie węgla. Proces ten jest bardzo gwałtowny i nazywany wybuchem supernowej.

Otoczka gwiazdy rozprasza się w przestrzeni, a centrum zapada tworząc gwiazdę neutronową.

Gwiazda neutronowa

W wyniku zapadania się centrum gwiazdy energie elektronów stają się tak duże, że w procesie zwanym odwrotnym rozpadem β protony zaczynają przechodzić w neutrony według następującej reakcji:

e + p n + v

Dokładne procesy przemiany materii zwykłej w materię bogatą w neutrony są skomplikowane, ale obliczenia pokazują, że przy gęstościach 1011 g/cm3 neutrony są znacznie liczniejsze niż protony. Stąd nazwa „gwiazda neutronowa”. Takie gęstości są osiągane gdy gwiazda kurczy się do rozmiarów rzędu dziesiątek km.

Gwiazda neutronowa może wirować wykonując dziesiątki obrotów na sekundę. Np. gwiazda w centrum Mgławicy Kraba jest taką gwiazdą wirującą 30 razy na sekundę. Gwiazdy neutronowe mogą wysyłać regularne promieniowanie (sygnały radiowe wysokiej częstości). Taka gwiazda nazywa się pulsarem. Pierwszy pulsar odkryto w 1967 r.

Jeżeli gwiazda ma masę początkową większą niż 8 mas Słońca to spalanie węgla przebiega w ich centrum spokojnie.

Następne fazy przebiegają bardzo szybko. Po wyczerpaniu węgla zapalają się kolejno: tlen, neon, magnez, krzem, nikiel. Końcowym produktem jest jądro żelazne, które wobec braku dalszych źródeł energii gwałtownie zapada się.

Implozji centrum towarzyszy eksplozja otoczki prowadząca do wybuchu bardzo jasnej supernowej. Pozostałością po wybuchu jest prawdopodobnie czarna dziura.

Czarna dziura

Czarna dziura jest obiektem astronomicznym, który nie może być bezpośrednio obserwowany, gdyż bardzo silne pole grawitacyjne, którego jest źródłem, uniemożliwia wysyłanie w przestrzeń jakichkolwiek informacji tzn. nie jest możliwe komunikowanie się z resztą świata. Pole grawitacyjne „przytrzymuje” nawet światło tzn. fotony nie mogą uciec z gwiazdy i zawsze „spadają” na jej powierzchnię. Choć obserwacja czarnych dziur nie jest możliwa to można obserwować procesy zachodzące w polu grawitacyjnym w otoczeniu czarnej dziury. Wciąż jest to kontrowersyjny mechanizm opisujący „katastrofalne” zapadanie się gwiazd. Można jednak wyznaczyć warunki na masę i promień.

Graniczny promień poniżej, którego nie możemy już zobaczyć gwiazdy (tzw. promień Schwartzschilda) jest dany wyrażeniem

Dla masy jądra (żelaznego) równej masie Słońca otrzymujemy R0 = 3 km.


Wyszukiwarka

Podobne podstrony:
Fizyka 0 wyklad organizacyjny Informatyka Wrzesien 30 2012
Fizyka wykład dajzeta 20 02 2011
temp krytyczna, TRANSPORT PWR, STUDIA, SEMESTR II, FIZYKA, fizyka-wyklad, zagadnienia opracowane, za
SiS strona tytulowa spr, Prz inf 2013, I Semestr Informatyka, Fizyka, Wykłady-Fizyka, Sygnały i Syst
fiza, BUDOWNICTWO PŁ, Semestr I, fizyka wykład
Tytuł, fizyka, wyklady
Fizyka 0 wyklad organizacyjny I Nieznany
Fizyka W 6 B, Fizyka wykłady i zagadnienia Czapla
Badaneie fizykalne - Wykłady
sprawozdanie 33a, fizyka 2 wykład i zagadnienia, 33
Fizyka wykłady ściaga
Kolokfium-fizyka, Wykłady i ćwiczenia
Opracowanie fizyka Wykład
Fizyka wykład 6
Fizyka wykłady doc
Pyt Ekz Fiz, Fizyka wykłady i zagadnienia Czapla
Zakres materiału, Technologia Chemiczna, Rok I, Fizyka, Wykłady fizyka
Zadania bryla sztywna, IŚ, Semestr 1, Fizyka, Wykłady
fizaju, BUDOWNICTWO PŁ, Semestr I, fizyka wykład

więcej podobnych podstron