목록Advanced computer architecture (13)
Kim Seon Deok
Pipeline multiple instruction의 실행을 overlap하여 performance를 향상시키는 기법 Instruction-level parallelism instruction 간 overlap되는 것을 말한다. - 하나의 instruction이 다른 instruction에 dependent 하다는 것을 결정하는 건 프로그램에 parallelism이 얼마나 많이 존재하고, 그 parallelism을 어떻게 활용할 수 있는지를 결정한다. - 만약 두 instruction이 parallel하고 pipeline이 충분한 자원을 갖추고 있어, structure hazard가 발생할 위험이 없다면, 임의의 depth의 pipeline에서 동시에 실행될 수 있다. ILP에 접근하는 방식 1. 하드..
2.3 Ten Advanced Optimizations of Cache Performance [cache optimization metric] hit time miss rate miss penalty cache bandwidth cache power comsumption [개선된 cache optimization 방법] Small and Simple First-Level Caches to Reduce Hit Time and Power cache hit의 critical timing path tag memory에 주소 접근 tag value와 address 비교 : address의 일부를 index로 사용하여 해당 블록의 tag와 비교 multiplexer 설정 : cache가 set associative..
2.1 introduction 대부분의 프로그램은 모든 코드나 data를 uniform하게 액세스하지 않는다. 이로 인해 locality가 필요하게 되었고, temporal한 방식과 spatial한 방식으로 나타난다. CPU의 memory hierarchy - cost per byte가 낮은 계층의 메모리만큼 저렴하고, 가장 높은 계층의 메모리만큼 빠른 memory system을 구축하는 것을 목표로 하기 때문에 여러 level로 나뉘게 되었다. 프로세서가 발전하면서 memory hierarchy의 중요성은 더욱 증가했다. -프로세서 라인에서는 초당 평균 memory request가 증가 -메모리 라인에서는 초당 DRAM access가 증가 시간이 지나면서 access time에서 프로세서와 DRAM의 ..