Advanced
Design of PID Controller with Adaptive Neural Network Compensator for Formation Control of Mobile Robots
Design of PID Controller with Adaptive Neural Network Compensator for Formation Control of Mobile Robots
Journal of the Korea Institute of Information and Communication Engineering. 2014. Mar, 18(3): 503-509
Copyright © 2014, The Korea Institute of Information and Commucation Engineering
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/li-censes/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
  • Received : December 03, 2013
  • Accepted : January 13, 2014
  • Published : March 31, 2014
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
TagCloud
About the Authors
용백 김
Automation Research Dept., Industrial Technology Institute, Hyundai Heavy Industries, Ulsan 682-793, Korea
진현 박
Dept. of Mechatronics Eng., Kyeognam National University of Science and Technology, Jinju 660-758, Korea
영규 최
Department of Electrical Engineering, Pusan National University, Pusan 609-735, Korea
ykichoi@pusan.ac.kr

Abstract
본 논문에서는 이동 로봇의 군집 제어를 위해 실시간 적응 신경 회로망 보상기를 갖는 PID 제어기를 제안한다. 전체 제어 시스템은 선도-추종 로봇 접근법에 의한 기구학 제어기와 이동 로봇의 동역학을 고려한 동적 제어기로 구성되어 있다. 동적 제어기는 PID 제어기에 동특성 변화를 보상하고 성능을 개선시키기 위해 실시간 학습 기능을 가진 신경 회로망 보상기로 구성하였다. 모의실험을 통해 원형 궤적과 직선 궤적에 대해 PID 제어기와 신경 회로망 보상기의 성능을 비교하였다. 이를 통해 실시간 학습 기능을 가진 신경 회로망 보상기가 PID 제어기의 성능을 향상시킴으로써 군집 제어에서 추종 로봇의 추종 성능을 향상시키는 것을 확인하였다.
Keywords
Ⅰ. 서 론
오늘날 로봇 산업의 발달로 산업 현장뿐만 아니라 다양한 분야에서 로봇이 많이 활용되고 있다. 특히 한대의 로봇으로 해결하기 어려운 문제를 여러 개체의 로봇을 사용하여 해결하려 협력 제어에 대한 연구가 활발히 연구되었으며, 이동 로봇의 경우 군집 제어에 대한 연구가 널리 연구되어 왔다 [1] . 이동 로봇의 군집 제어는 행동 기반(behavior-based) 방식, 선도 로봇 추종(leader-follower) 방식, 가상 구조(virtual structure) 방식 등 다양한 형태가 연구되었으며, 이중에서 추종로봇이 선도 로봇을 추종하는 방식이 개념이 간단하고 여러대의 로봇으로 확장성이 용이하여 많은 연구가 이루어졌다 [2 - 5] .
일반적인 군집제어와 관련된 연구는 선도 로봇과 추종 로봇의 기구학적 관계만을 고려한 기구학적 제어기 설계가 주를 이루었으나 [2 - 4] , 실제 추종 로봇의 질량 및 관성 등의 동적 특성에 의해 추종 로봇의 선속도와 각속도를 완벽히 추종할 수 없다. 따라서 추종 로봇의 동역학적 특성이 고려된 제어기 설계에 관한 연구가 필요하다 [6] .
일반적인 선형 PID 제어기는 구조가 단순하고 구현이 용이하여 각종 산업 현장에서 많이 사용되고 있으나, 부하 및 제어 동작 범위가 변화하거나 비선형 제어 시스템일 경우, 적절한 이득과 성능을 얻기가 어렵다. 따라서 추종 로봇의 동역학을 고려한 제어기를 단순한 PID 제어기로 설계 시 제어의 성능을 보장할 수 없다.
본 논문에서는 군집제어와 관련된 연구로 추종 로봇이 선도 로봇과 일정 거리와 각도를 유지하며 추종하고자 한다. 추종 로봇이 선도 로봇을 정밀하게 추종하기 위하여 선도 로봇과 추종 로봇의 기구학적 관계로부터 기구학적 제어기를 설계하고 추종 로봇의 동역학을 고려한 동역학 제어기를 설계하고자 한다. 추종 로봇의 동역학 제어기는 적응적인 신경 회로망 보상기를 갖는 PID 제어기로 구성하였다 [7] . 선형 PID 제어기 의 이득은 인공 면역망 알고리즘에 의해 최적의 PID 제어기 이득을 설계하고, 설계된 최적 PID 제어기에 의해서도 발생하는 추종 오차는 비선형 시스템에 적합한 신경 회로망을 사용하여 보상하고자 한다. 모의실험을 통하여 실시간 학습 기능을 가진 신경 회로망 보상기를 갖는 PID 제어기가 일반적인 PID 제어기에 비하여 군집 제어에서 추종 로봇의 추종 성능을 향상시키는 것을 확인하였다.
Ⅱ. 이동 로봇의 군집 제어
- 2.1. 기구학적 제어기 설계
그림 1 은 선도 로봇과 추종 로봇 사이의 기구학적 관계를 표현하였다. 선도 로봇은 선속도 υ i 와 각속도 ω i 가 정해져 있으며, 선도 로봇과 추종 로봇이 다른 위치에서 출발하여 각 로봇의 상대 거리 lij 와 추종 각도 Ψij 가 일정하게 유지되도록 제어하고자 한다.
PPT Slide
Lager Image
선도 추종 방식의 군집 로봇들 Fig. 1 Leader-follower based formation robots
상대거리와 추종 각도에 대한 기구학 방정식은 식 (1)과 같이 표현할 수 있다 [3] .
PPT Slide
Lager Image
여기서, i 는 선도 로봇, j 는 추종 로봇, Zij =[ lij Ψij ] T 은 두 로봇 사이의 거리와 각도, ui =[ υ i ω i ] T 는 선도 로봇의 선속도와 각속도, uj =[ υ j ω j ] T 는 추종 로봇의 선속도와 각속도를 나타내며, βij = θi - θj 는 이동 로봇의 각도 오차, γij = βij + Ψij
PPT Slide
Lager Image
PPT Slide
Lager Image
이다.
그림 2 는 선도 로봇과 추종 로봇의 기구학적 관계만을 고려한 군집 로봇의 제어 블록선도를 나타낸다. 추종 로봇이 선도 로봇과 일정 거리
PPT Slide
Lager Image
와 추종 각도
PPT Slide
Lager Image
를 유지하며 추종하고자 한다. 추종 로봇의 동역학은 포함되지 않으며, 선도 로봇은 이상적인 기구학에 의해 동작한다고 가정하였다.
PPT Slide
Lager Image
기구학적 군집 제어 시스템 Fig. 2 Kinematic control system for formation robots
추종 로봇의 속도 제어 입력 값 [ υ j ω j ] T 을 구하기 위하여 입출력 피드백 선형화(input-output feedback linearization) 기법을 적용하면 식 (2)와 같이 나타낼 수 있다 [3] .
PPT Slide
Lager Image
여기서,
PPT Slide
Lager Image
, k 1 , k 2 >0 인 사용자 정의 상수이다.
PPT Slide
Lager Image
로 정의하고 시간 t 와 무관한 상수벡터이므로 폐루프 방정식은 아래와 같이 쓸 수 있다.
PPT Slide
Lager Image
따라서 k 1 , k 2 가 양의 상수이면 안정함을 알 수 있다.
식 (2)를 구체적으로 표현하면 추종 로봇의 속도 제어 입력은 식 (4)과 같이 구할 수 있다.
PPT Slide
Lager Image
여기서
PPT Slide
Lager Image
이다.
- 2.2. 추종 로봇의 동역학 제어기 설계
군집제어는 선도 로봇과 추종 로봇이 일정 거리
PPT Slide
Lager Image
와 일정 각도
PPT Slide
Lager Image
를 유지하는 것을 목적으로 하고 있다. 2.1절과 같이 두 로봇 사이의 기구학적 관계만을 고려하여 제어기를 설계할 경우, 정밀한 제어 성능을 보장할 수 없다. 이는 추종 로봇의 동역학으로 인해 식 (4)의 기구학 제어기에 의해 구한 선속도와 각속도 uj = [ υ j ω j ] T 를 완벽히 추종할 수 없기 때문이다. 그러므로 추종 로봇의 동역학을 고려한 제어 시스템을 새롭게 구성하여야 한다.
본 논문에서 고려하는 비 홀로노믹(nonholonomic) 이동 로봇의 동역학 모델로 식 (5)와 같이 구성되어 있다 [6] .
PPT Slide
Lager Image
여기서 q = [ x y θ ] T 은 관성(inertia) 행렬,
PPT Slide
Lager Image
은 원심력과 코리올리스 행렬,
PPT Slide
Lager Image
은 마찰력(friction), G ( q )는 중력(gravity), τd 는 미지의 외란(disturbance), B ( q )은 입력 변환 행렬, τ 는 입력 토크, A ( q )은 구속 조건 행렬, λ는 구속력 벡터를 나타낸다.
본 논문에서 이동 로봇의 운동은 수평면에 제한되어 있으므로 중력 G ( q ) = 0, 마찰력과 외란은 무시할 수 있는 작은 값이라고 가정한다. 그림 3 은 식 (5)의 추종 로봇 동역학을 고려한 전체 제어 시스템의 블록선도를 나타내었다.
PPT Slide
Lager Image
전체 시스템 블록선도 Fig. 3 Block diagram of the total system
Ⅲ. 신경회로망 보상기와 학습 알고리즘
- 3.1. 신경 회로망 보상기
PID 제어기는 구조가 단순하고 이득 동조 과정이 비교적 간단하기 때문에 산업 현장에서 널리 사용되고 있으나 부하 및 제어 동작 범위가 변화하거나 비선형 제어 시스템일 경우 적절한 이득과 성능을 얻기가 어렵다.
그림 4 는 추종 로봇의 동역학 제어기로써 적응적인 신경 회로망 보상기를 갖는 PID 제어기의 구조를 나타내었다 [7] . 선형 PID 제어기에 의해서도 발생하는 추종 로봇의 오차를 비선형 시스템에 적합한 신경 회로망 보상기가 줄이고자 한다.
PPT Slide
Lager Image
신경 회로망 보상기를 포함한 PID 제어기의 구조 Fig. 4 Configuration of PID controller with neural network compensator
적응적 신경 회로망 보상기는 2개의 은닉층과 1개의 출력층으로 구성되어 있으며 2개의 입력과 2개의 출력으로 구성하였다.
- 3.2. 신경 회로망 보상기의 학습 알고리즘
기준 입력과 플랜트 출력의 에러를 줄이기 위한 적응적 신경 회로망 보상기는 식 (6)의 에러를 최소화하기 위한 오류 역전파(error back propagation) 알고리즘을 적용하여 신경 회로망의 가중치를 학습한다.
PPT Slide
Lager Image
여기서
PPT Slide
Lager Image
는 오른쪽 바퀴와 왼쪽 바퀴의 각속도 목표 값이고, qi ( t ) = [ ω r ω l ] T 는 각속도 측정 값이다. 출력층에서 은닉층 2 사이의 신경 회로망 가중 치의 학습은 식 (7)을 사용하였다 [7] .
PPT Slide
Lager Image
여기서 ξ 1 는 학습율이다.
위 식 (7)에서 시스템의 응답 특성을 반영하기 위해서 E ( t )대신에 E ( t +1)이 사용되었다.
PPT Slide
Lager Image
여기서,
PPT Slide
Lager Image
이다.
PPT Slide
Lager Image
는 PID 제어기에 입력되는 보상된 제어 입력으로 PID 제어기에 의해 플랜트 출력이 기준 입력을 잘 추종한다면 식 (9)와 같이 가정할 수 있다.
PPT Slide
Lager Image
여기서 cki k = i 인 경우에 양의 상수, k i 인 경우에 0이다.
샘플링 타임이 작다면 ϵk ( t +1) ≈ ϵk ( t )이므로 신경 회로망의 가중치에 대한 학습 규칙은 다음 식 (10)과 같다.
PPT Slide
Lager Image
여기서, Hjl ( t )는 은닉층 2와 은닉층 1 사이의 가중치, Vlk ( t )는 은닉층 1과 입력층 사이의 가중치를 나타낸다.
Ⅳ. 모의실험
본 논문에서 제안한 적응 신경 회로망 보상기를 갖는 PID 제어기의 성능 검증을 위하여 선도 로봇이 원형 궤적과 직선 궤적으로 주행할 경우를 모의실험 하였다. 또한 제안된 제어기의 성능 비교 평가를 위해 PID 제어기를 사용하였다. PID 제어기는 이득 값에 따라 제어 성능에 크게 영향을 미치므로, 실험적으로 구한 적절한 이득 값과 인공 면역망 알고리즘(Artificial Immune Algorithm)을 이용하여 구한 최적의 이득 값을 사용한 경우에 대하여 비교 실험을 수행하였다.
최적의 PID 제어기 이득 값을 찾기 위하여 인공 면역망 알고리즘을 사용하였으며, 평가함수는 식 (11)과 같이 정의하였다.
PPT Slide
Lager Image
여기서,
PPT Slide
Lager Image
은 상대 거리 오차,
PPT Slide
Lager Image
는 상대 각도 오차이며, α , β 는 평가 함수의 가중치로 α = 2/3, β = 1/3를 사용하였다.
인공 면역망의 학습 조건은 세대수 50, 개체 수 10, 돌연변이 비율 0.1, 복제 비율은 0.5로 설정하여 PID 제어기의 최적 이득 값을 구하였다.
인공 면역망에 의해 학습된 최적의 PID 이득 값은 Kp =2.886, Ki =0.049, Kd =0.068이다. 비교 평가를 위하 여 적절한 PID 제어기의 이득 값은 실험을 통하여 구한 Kp =1.996, Ki =0.03, Kd =0.0426으로 선정하였다.
비교 실험을 위해 다음의 4가지 경우에 대해 모의실험을 진행하였다.
  • case 1: 적절한 이득을 가진 PID 제어기
군집 제어 모의실험을 위하여 선도 로봇과 추종 로봇들의 제원은 바퀴 사이 거리 2 R = 1 m , 바퀴 반지름 r = 0.05 m , 로봇 길이 d = 0.1 m 이며, 로봇의 무게 m = 40 kg , 관성 I = 20 kgm 2 , 제어 샘플링 타임 t = 10 msec 로 설정하였다. 그리고 선도 로봇과 추 종 로봇간의 목표 상대 거리
PPT Slide
Lager Image
= 1.5 m , 추종 각도
PPT Slide
Lager Image
= 3π/4 rad 이며, 선도 로봇과 추종 로봇의 초기 위치와 자세 각도는 각각( xi , yi , θi ) = (0,0,π/2), ( xj , yj , θj ) = (3.5, -0.1, -π/2),로 선정하였다.
추종 로봇의 추종 성능 평가를 위한 선도 로봇의 궤적을 두 가지로 설정하였다.
  • 원형 궤적 :υr=0.5m/sec와wr=0.1rad/sec
그림 5 는 선도 로봇의 원형 궤적에 대해 4가지 제어 방법을 적용한 추종 로봇의 추종 결과이며, 그림 6 은 각각의 거리 오차와 각도 오차를 표시하였다. 모의실험 결과 case 4, case 3, case 2, case 1의 순서로 성능이 좋음을 알 수 있다. 이는 신경 회로망 보상기를 갖는 PID 제어기가 최적의 이득을 갖는 PID 제어기에 비해서도 뛰어나며, 특히 case 3이 case 2보다 뛰어난 성능을 나타냄은 적절한 이득 값을 갖는 PID 제어기에 신경망 보상기를 첨가할 경우에도 성능이 향상됨을 알수 있다.
PPT Slide
Lager Image
선도 로봇과 추종 로봇의 원형 궤적 Fig. 5 Circular trajectories of the leader and follower robots
PPT Slide
Lager Image
원형 궤적에 대한 추종 오차 (a) 거리 오차 (b) 각도 오차 Fig. 6 Tracking errors for circular trajectories (a) Distance errors (b) Angle errors
그림 7 , 8 은 선도 로봇의 직선 궤적에 대한 추종 로봇의 궤적과 추종 오차를 표시하였다. 직선 궤적 추종에 대한 성능 역시 신경 회로망 보상기를 갖는 제어방법인 case4, case3이 가장 뛰어난 성능을 보였다.
PPT Slide
Lager Image
선도 로봇과 추종 로봇의 직선 궤적 Fig. 7 Linear trajectories of leader and follower robots
PPT Slide
Lager Image
직선 궤적에 대한 추종 오차 (a) 거리 오차 (b) 각도 오차 Fig. 8 Tracking errors for linear trajectories (a) Distance errors (b) Angle errors
본 논문에서 제안한 신경 회로망 보상기를 갖는 PID 제어기가 PID 제어기에 비해 최적의 PID 이득 값이 아니더라도 신경 회로망 보상기를 통해 최적의 성능을 발휘함을 알 수 있다.
Ⅴ. 결 론
본 논문에서 이동 로봇의 군집 제어를 위해 선도 로봇과 추종 로봇의 기구학적 관계로부터 기구학적 제어기를 설계하고 추종 로봇의 동역학을 고려한 동역학 제어기를 설계하였다. 추종 로봇의 동역학 제어기는 적응적인 신경 회로망 보상기를 갖는 PID 제어기로 구성하였다.
또한 제안된 실시간 학습 기능을 가진 신경 회로망 보상기를 갖는 PID 제어기와 인공면역망 알고리즘을 통해 설계된 최적의 이득을 가진 PID 제어기를 모의실험을 통해 비교하였다. 고정 이득을 가지는 일반적인 선형 PID 제어기에 비해 실시간 학습을 통해 에러에 대해 추가적인 보상 기능을 가진 PID 제어기가 군집 제어에서 추종 로봇의 추종 성능을 향상시키는 것을 확인하였다. 향후 실제 이동로봇의 추종 제어에 적용하여 센서 노이즈, 외란 및 모델 불확실성에 대해 강인한 제어기에 대한 타당성 검증이 필요하다.
BIO
김용백(Yong-Baek Kim)
1998년 2월 부산대학교 전기공학과 학사
2000년 2월 부산대학교 대학원 전기공학과 석사
2011년 2월 부산대학교 대학원 전기공학과 박사수료
2000년 1월 ~ 현재 현대중공업 중앙기술원 생산기술연구소 자동화연구실 책임연구원
※ 관심분야: 로보틱스, 지능제어, 임베디드 시스템, 지능형 용접 로봇
박진현(Jin-Hyun Park)
1992년 2월 부산대학교 전기공학과 학사
1994년 2월 부산대학교 대학원 전기공학과 석사
1997년 2월 부산대학교 대학원 전기공학과 박사
1997년 3월 ~ 1999년 2월 부산정보대학 전기전자계열 전임강사
1996년 7월 ~ 1997년 8월 Dept. of System Engineering, Arkansas Univ. of Little Rock, Visiting Scholar
1999년 3월 ~ 현재 경남과학기술대학교 메카트로닉스공학과 교수
※ 관심분야: 지능제어, 최적제어, 로보틱스, 제어계측
최영규(Young-Kiu Choi)
1980년 2월 서울대학교 전기공학과 공학사
1982년 2월 KAIST 전기 및 전자공학과 공학석사
1987년 2월 KAIST 전기 및 전자공학과 공학박사
1986년 ~ 현재 부산대학교 전기공학과 교수
※ 관심분야: 로봇제어, 지능제어, 신경회로망 등
References
Cao Y. U. , Fukunaga A. S. , Kahang A. B. 1997 “Cooperative mobile robotics: antecedents and directions,” Auton. Robots http://dx.doi.org/10.1023/A:1008855018923 4 (1) 7 - 27    DOI : 10.1023/A:1008855018923
Desai J. P. , Ostrowski J. , Kumar V. 2001 “Modeling and control of formations of nonholonomic mobile robots,” IEEE Trans. Robotics and Automations http://dx.doi.org/10.1109/70.976023 17 (6) 905 - 908    DOI : 10.1109/70.976023
Das A. K. , et al 2002 “A vision-based formation control framework,„ IEEE Trans. on Robotics and Automaton et al http://dx.doi.org/10.1109/TRA.2002.803463 18 (5) 813 - 825    DOI : 10.1109/TRA.2002.803463
Shao J. , Xie G. , Wang L. 2007 “Leader-following formation control of multiple mobile vehicles,” IET Control Theory and Applications http://dx.doi.org/10.1049/iet-cta:20050371 1 (2) 545 - 552    DOI : 10.1049/iet-cta:20050371
Chen Y. Q. , Wang Z. 2005 “Formation control: a review and a new consideration,” Proceeding of the IEEE International Conference on Intelligent Robots and systems New York NY 3181 - 3186
E. R. Fierro , F. L. Lewis 1998 “Control of a nonholonomic mobile robot using neural networks,” IEEE Trans on Neural Networks 9 (4)
Choi Y. K. , Lee M. J. , Kim S. S. 2001 “Design and Implementation of an adaptive neural network compensator for control systems,” IEEE Trans. on Industrial Electronics 48 (2)